javascript中使用正则表达式清理table样式的代码
项目中遇到这样的需求,一大段文章正文的html代码在手机中显示不全,原因是由于其它有table,而table表格中的tr/td都携带了从word中粘贴过来的样式,需要将这一大段的字符串中的table、tr、td中携带的样式清除掉,同时还不能破坏table结构,即要保留tr中的rowspan和td中的colspan属性。
html部分代码如下:
<pclass="MsoNormal"align="left"style="text-align:left"><spanlang="EN-US"> <o:p>文字中华人民共和国文字中华人民共和国文字中华人民共和国</o:p> </span></p> <table> <tbody> <trstyle="height:13.5pt"> <tdwidth="117"style="width:88.0pt;border:solidwindowtext1.0pt;padding:0cm5.4pt0cm5.4pt;height:13.5pt"><pclass="MsoNormal"align="center"style="text-align:center"><spanstyle="font-family:宋体;color:#1F497D">项目<spanlang="EN-US"> <o:p></o:p> </span></span></p></td> <tdwidth="137"style="width:103.0pt;border:solidwindowtext1.0pt;border-left:none;padding:0cm5.4pt0cm5.4pt;height:13.5pt"><pclass="MsoNormal"align="center"style="text-align:center"><spanstyle="font-family:宋体;color:#1F497D">金额<spanlang="EN-US"> <o:p></o:p> </span></span></p></td> <tdwidth="153"style="width:115.0pt;border:solidwindowtext1.0pt;border-left:none;padding:0cm5.4pt0cm5.4pt;height:13.5pt"><pclass="MsoNormal"align="center"style="text-align:center"><spanstyle="font-family:宋体;color:#1F497D">经办人<spanlang="EN-US"> <o:p></o:p> </span></span></p></td> <tdwidth="135"style="width:101.0pt;border:solidwindowtext1.0pt;border-left:none;padding:0cm5.4pt0cm5.4pt;height:13.5pt"><pclass="MsoNormal"align="center"style="text-align:center"><spanstyle="font-family:宋体;color:#1F497D">是否有发票<spanlang="EN-US"> <o:p></o:p> </span></span></p></td> </tr> <trstyle="height:13.5pt"> <tdwidth="117"style="width:88.0pt;border:solidwindowtext1.0pt;border-top:none;padding:0cm5.4pt0cm5.4pt;height:13.5pt"><pclass="MsoNormal"align="center"style="text-align:center"><spanstyle="font-family:宋体;color:#1F497D">合计<spanlang="EN-US"> <o:p></o:p> </span></span></p></td> <tdcolspan="3"valign="bottom"nowrap=""style="width:103.0pt;border-top:none;border-left:none;border-bottom:solidwindowtext1.0pt;border-right:solidwindowtext1.0pt;padding:0cm5.4pt0cm5.4pt;height:13.5pt"><pclass="MsoNormal"align="center"style="text-align:center"><spanlang="EN-US"style="font-size:11.0pt;font-family:宋体;color:black"> <o:p></o:p> </span></p></td> </tr> </tbody> </table> <pclass="MsoNormal"><spanstyle="font-family:宋体;color:#1F497D">文字中华人民共和国文字中华人民共和国文字中华人民共和国。</span><spanlang="EN-US"style="color:#1F497D"> <o:p></o:p> </span></p>
JS脚本如下:
/* *格式化内容,str即是html格式的字符串 */ functionformatContent(str){ str=str.replace(/<\/?(html|head|title|meta|body)\b[^>]*>/ig,""); str=str.replace(/<table[^>]*>/ig,"<table>"); returnstr; str=str.replace(/(<tr[^>]*>)/ig,function(a,b){ if(a.indexOf('rowspan')>-1){ a=a.replace(/([a-z]+)="([^"]+)?"/ig,function(c,d,e){ returnd==='rowspan'?(d+'="'+e+'"'):''; }) returna; }else{ return'<tr>'; } }); str=str.replace(/(<td[^>]*>)/ig,function(a,b){ if(a.indexOf('colspan')>-1){ a=a.replace(/([a-z]+)="([^"]+)?"/ig,function(c,d,e){ returnd==='colspan'?(d+'="'+e+'"'):''; }) returna; }else{ return'<td>'; } }); returnstr; }
毛票票小编再给大家推荐一个
//表格替换 str=str.replace(/<table[^<>]*>/ig,"<table>"); str=str.replace(/<thead[^<>]*>/ig,"<thead>"); str=str.replace(/<tbody[^<>]*>/ig,"<tbody>"); str=str.replace(/<tfoot[^<>]*>/ig,"<tfoot>"); str=str.replace(/<tr[^<>]*>/ig,"<tr>"); str=str.replace(/<th[^<>]*>/ig,"<th>"); str=str.replace(/<td[^<>]*>/ig,"<td>"); str=str.replace(/<th>\s*?<p>/ig,"<th>"); str=str.replace(/<\/p>\s*?<\/th>/ig,"</th>"); str=str.replace(/<td[^<>]*>\s*?<p>/ig,"<td>"); str=str.replace(/<td>\s*?<p>/ig,"<td>"); str=str.replace(/<\/p>\s*?<\/td>/ig,"</td>");
这样对于表格中所有出现的标签都进行了替换,因为现在都是用css控制的,基本上不用这么多参数什么的了,除非特殊的表格
以上所述就是本文的全部内容了,希望大家能够喜欢。