java过滤html标签获取纯文本信息的实例
如下所示:
packagecom.lyt.base.util; importjava.util.regex.Pattern; publicclassFilterHtmlUtil{ publicstaticStringHtml2Text(StringinputString){ StringhtmlStr=inputString;//含html标签的字符串 StringtextStr=""; java.util.regex.Patternp_script; java.util.regex.Matcherm_script; java.util.regex.Patternp_style; java.util.regex.Matcherm_style; java.util.regex.Patternp_html; java.util.regex.Matcherm_html; try{ StringregEx_script="<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>";//定义script的正则表达式{或