收集一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~)
正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番。我将一些常用的表达式收藏在这里,作备忘之用。本贴随时会更新,请持续关注本站。
匹配中文字符的正则表达式:[\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):[^\x00-\xff]
应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
String.prototype.len=function(){returnthis.replace([^\x00-\xff]/g,"aa").length;}
匹配空行的正则表达式:\n[\s|]*\r
匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*)\/>/
匹配首尾空格的正则表达式:(^\s*)|(\s*$)
String.prototype.trim=function()
{
returnthis.replace(/(^\s*)|(\s*$)/g,"");
}
利用正则表达式分解和转换IP地址:
下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序:
functionIP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g//匹配IP地址的正则表达式
if(re.test(ip))
{
returnRegExp.1∗Math.pow(255,3))+RegExp.2*Math.pow(255,2))+RegExp.3∗255+RegExp.4*1
}
else
{
thrownewError("NotavalidIPaddress!")
}
}
不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下:
varip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配网址URL的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?
利用正则表达式去除字串中重复的字符的算法程序:[注:此程序不正确,原因见红色字体]
vars="abacabefgeeii"
vars1=s.replace(/(.).*\1/g,"$1")
varre=newRegExp("["+s1+"]","g")
vars2=s.replace(re,"")
alert(s1+s2)//结果为:abcefgi
===============================
如果vars="abacabefggeeii"
结果就不对了,结果为:abeicfgg
正则表达式的能力有限
我原来在CSDN上发贴寻求一个表达式来实现去除重复字符的方法,最终没有找到,这是我能想到的最简单的实现方法。思路是使用后向引用取出包括重复的字符,再以重复的字符建立第二个表达式,取到不重复的字符,两者串连。这个方法对于字符顺序有要求的字符串可能不适用。
得用正则表达式从URL地址中提取文件名的javascript程序,如下结果为page1
s="http://www.9499.net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)
利用正则表达式限制网页表单里的文本框输入内容:
用正则表达式限制只能输入中文:
onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')"onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"
用正则表达式限制只能输入全角字符:
onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')"onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"
用正则表达式限制只能输入数字:
onkeyup="value=value.replace(/[^\d]/g,'')"onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"
用正则表达式限制只能输入数字和英文:
onkeyup="value=value.replace(/[\W]/g,'')"onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"
应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下:
/**
*计算字符串长度,将非宽字符计算为半个字符
*
*@paramstr
*@returns
*/
functiongbLength(str){
returntypeofstr==="string"?str.length+str.replace(/[\x00-\x7f]/g,'').length+1>>1:0;
}
/**
*获取字符串的指定长度的子串,将非宽字符计算为半个字符
*
*@paramstr
*@paramlength
*@returns
*/
functiongbSubstr(str,length){
if(typeofstr!=="string")
returnstr;
length+=length;
for(varn=0,L=str.length;n<L&&length>0;n++){
length-=str.charCodeAt(n)>127?2:1;
}
returnstr.substr(0,n);
}
/**
*切割指定字符串的指定长度子串,如果长度超过指定长度,则丢弃末尾两个字符并附加...
*
*@paramstr
*@paramlen
*@returns
*/
functionfit_length(str,len){
len=len||16;
if(typeofstr!=="string"||str.length<=len||gbLength(str)<=len){
returnstr;
}
varret=gbSubstr(str,len-2);
returnret+'..';
}
varreplaceCJK=/[^\x00-\xff]/g,
testCJK=/[^\x00-\xff]/;
cjkLength:function(strValue){
returnstrValue.replace(replaceCJK,"lv").length;
},
isCjk:function(strValue){
returntestCJK.test(strValue);
},
cutString:function(str,len,suffix,slen){
suffix=suffix||'';
slen=slen||suffix.length;
if(str.length>len){
str=str.substr(0,len-slen)+suffix;
}
returnstr;
},
cutCjkString:function(str,len,suffix,slen){
suffix=suffix||'';
slen=slen||suffix.length;
len-=slen;
if(this.cjkLength(str)<=len){
returnstr;
}
vars=str.split(''),c=0,tmpA=[];
for(vari=0;i<s.length;i+=1){
if(c<len){
tmpA[tmpA.length]=s[i];
}
if(this.isCjk(s[i])){
c+=2;
}else{
c+=1;
}
}
returntmpA.join('')+suffix;
}
}
以上内容给大家分享我日常收集的一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行andsoon~~~),希望大家喜欢。欲了解更多,请持续关注本站。