将html文本中所有的标签替换掉的方法
时间:2021-07-01 10:21:17
帮助过:380人阅读
(?i) 表示不匹配大小写。不管大写还是小写都给替换掉
html = html.replaceAll("(<(?i)(|)[^]*/?>)|( )|(')|(\")", "");
System.out.println(html);
(<(?i)(|)[^]*/?>)|( )|(')|(\") -- 匹配全部的标签与空格和引号
若只替换一部分则进行下面的修改
(<(?i)(|)[^]*/?>) --替换全部的标签
(<(?i)(p|img)[^]*/?>) --替换p和img标签
(<(?i)a[^]*/?>) --仅替换a标签