关于Java中去除字符串中HTML标记的说明

我们可以通过正则表达式匹配HTML标签,然后将其去除:

// 去除HTML标记
s = s.replaceAll("</?[^>]+>", "");
// 去除空格、回车、换行符、制表符
s = s.replaceAll("<a>\\s*|\t|\r|\n</a>", "");
return s;

发表评论