常用正则表达式知识点解读及判读有效数字、手机号邮箱正则表达式

2024-03-25 18:22:03 379

1、正则仅仅就是用来处理字符串的：匹配、捕获

匹配：验证当前的字符串是否符合我们的规则（每一个正则都是一个规则）
捕获：在整个字符串当中，把符合规则的字符都依次的获取到--->exec、match、replace

2、正则的组成：元字符、修饰符

元字符：

特殊意义的元字符：

\d匹配一个0-9的数字相当于[0-9]，和它相反的
\D匹配一个除了0-9的任意字符相当于【】
\w匹配一个0-9、a-z、A-Z_的数字或字符，相当于[0-9a-zA-Z_] 、
\s匹配一个空白字符（空格、制表符。。。）
\b匹配一个单词的边界“w100w000”
\t匹配一个制表符
\n匹配一个换行
.匹配一个除了\n以外的任意字符
^以某一个元字符开头
$以某一个元字符结尾
\转译字符
x|y x或者y的一个
[xyz]x、y、z、中的任意一个
[^xyz]除了x、y、z、中的任意一个
[a-z]->匹配a-z中的任意一个字符
[^a-z]->匹配除了a-z中的任意一个字符
()正则中的分组

量词：

* 0到多个
+ 1到多个
? 0到1个

？在正则中的意义比较多

放在一个非量词元字符后面代表出现0-1次例如/^\d?$/出现0-9直接的数0到1次

放在一个量词元字符后面，取消捕获时候的贪婪性 /^\d+?$/捕获的时候只是把第一个捕获的数字获取"2015"--->2
(?:)分组值匹配不捕获
(?=)正向预查
(?!)负向预查

()的作用
1)改变默认的优先级
2)可以进行分组捕获
3)分组引用

{n}出现n次
{n,}出现n到多次
{n,m}出现n到m次

普通元字符

任何字符在正则中除了以上有特殊意义的，其他的都是代表本身意思的普通元字符

修饰符：

i：忽略字母的大小写
m：multiline多行匹配
g：global全局匹配

项目中经常使用的正则

1）判断是有效数字的正则

有效数字是指：正数、负数、零、小数

第一部分：可能出现加减或者没有
第二部分：一位数可以是0，多位数不能以0开头
第三部分：可以有小数也可以没有小数，但是一旦出现小数点，后面至少跟一位数字
varreg=/^[+-]?(\d|[1-9]\d+)(\.\d+)?$/;

有效的正整数（包含0）：/^[+]?(\d|[1-9]\d+)$/;

有效的负整数（包含0）：/^-(\d|[1-9]\d+)$/;

判断手机号（简单版）：
var reg=/^1\d{10}$/;

判断邮箱
第一部分：数字、字母、下划线、-一到多位
第二部分：@
第三部分：数字、字母、一到多位
第四部分：(.两到四位).com .cn .net .. .com.cn
varreg=/^[0-9a-zA-Z_-]+@[0-9a-zA-Z-]+(\.[a-zA-Z]{2,4}){1,2}$/

判断年龄在18到65之间的
18-19/20-59/60-65
var reg=/^((18|19)|([2-5]\d)|(6[0-5]))$/

真实有效的中华人民共和国姓名2-4位汉字
varreg=/^[\u4e00-\u9fa5]{2,4}$/;

身份证号码
前六位是省->市->县（区）
四位年两位月两位日

简单版

varreg=/^\d{17}(\d|X)$/;
130828199012040617

复杂版

varreg=/^(\d{2})(\d{4})(\d{4})(\d{2})(\d{2})(?:\d{2})(\d)(?:\d|X)$/;

细节知识点

里面出现的任何字符都是代表本身意义的，例如：[.]中的”.“就是代表一个小数点而不是除了\n以外的任意字符
里面出现18不是数字18而是1或者8，例如[18-65]是1或者8-6或者5中任选一个

1、exec正则的捕获方法--->先匹配，然后把匹配的内容捕获

如果字符串没有匹配这个正则，捕获的返结果是null

如果和正则匹配，返回的结果是一个数组

例子
varstr="2015zhufeng2016peixun"
varreg=/\d+/;

第一项是我们捕获的内容

index：捕获的内容在元字符串中开始的索引位置
input：捕获的原始字符串

2、正则的捕获是懒惰的

正则的每一次捕获都从lastIndex值开始，第一次捕获的时候，lastIndex=0，从原始字符串索引为0的位置开始查找捕获，而默认的情况下，第一次捕获完成，lastIndex的值并没有发生改变，还是0，所以第二次捕获还是从原始字符串索引为0处开始查找，这样找到的还是第一次捕获的内容
解决办法：添加全局修饰符g--->加上g后，第一次捕获完成后，lastIndex的值发生了改变，变为第一次捕获内容后的第一个字符的开始索引，第二次捕获是继续向后查找的...
疑问：不用全局修饰符g每次捕获完成后手动修改lastIndex的值不可以么？
不可以，虽然手动修改了lastIndex，确实把lastIndex的值进行改变了，但是正则查找的时候还是从索引0开始的

varstr="zhufeng2015peixun2016";
varreg=/\d+/g;

例子

为了防止没有加全局修饰符g导致的死循环,我们在处理之前,对于没有添加g的手动给添加一个g

RegExp.prototype.myExecAll=functionmyExecAll(){
var_this=this,str=arguments[0],ary=[],res=null;
!_this.global?_this=eval(_this.toString()+"g"):null;
res=_this.exec(str);
while(res){
ary[ary.length]=res[0];
res=_this.exec(str);
}
returnary;
};
varary=reg.myExecAll(str);
console.log(ary);
console.log(reg.lastIndex);//->0
varres=reg.exec(str);
console.log(res);
console.log(reg.lastIndex);//->11
res=reg.exec(str);
console.log(res);
console.log(reg.lastIndex);//->21
res=reg.exec(str);
console.log(res);//->null

3、match:捕获字符串中存在一个叫做match的方法也可以实现捕获，而且只要我们取消了正则的懒惰性，执行一次match方法就可以捕获到所有内容了

varstr="zhufeng2015peixun2016";
varreg=/\d+/g;
console.log(str.match(reg));

疑问:那我们都用match来替换exec多好啊?

4、正则的分组捕获

每一次捕获的时候，不仅仅可以把大正则匹配的内容捕获到，而且还可以把每一个小分组（子正则）匹配的内容单独的捕获到

varstr="zhufeng[2015]peixun[2016]";
varreg=/\[(\d)(\d+)\]/g;
varres=reg.exec(str);
console.log(res);
["[2015]","2","015",index:7,input:"zhufeng[2015]peixun[2016]"]

第一项是大正则捕获的内容res[0]
第二项是第一个分组捕获的内容res[1]
第三项是第二个分组捕获的内容rex[2]
。。。。。

分组的只匹配不捕获:我们如果执行把分组内容进行匹配但是不进行捕获的话,只需要在分组的前面加上?:即可

varstr="zhufeng[2015]peixun[2016]";
varreg=/\[(?:\d)(\d+)\]/g;
varres=reg.exec(str);
console.log(res);
["[2015]","015"...]

数组中的第一项是大正则捕获的内容res[0]
数组中的第二项是第二个分组捕获的内容res[1]
第一个分组添加了?:,所以只匹配不捕获

5、exec和match的区别

match只能捕获大正则匹配的内容，对于分组捕获中，是无法获取分组匹配的内容的，所以如果捕获的时候不需要捕获分组的内容，我们直接用match更方便，如果需要捕获分组的内容，我们只能使用exec来一个个捕获

varstr="zhufeng[2015]peixun[2016]";
varreg=/\[(\d+)\]/g;
//console.log(str.match(reg));//->["[2015]","[2016]"]
varary=[];
varres=reg.exec(str);
while(res){
//ary.push(res[1]);
ary.push(RegExp.$1);//RegExp.$1获取当前正则第一个分组捕获的内容，（可能在部分IE浏览器下捕获不到值）
res=reg.exec(str);
}
console.log(ary);

6、正则的贪婪性：在每一次的捕获的时候，总是按照正则匹配的最长结果捕获

varstr="zhufeng2015peixun2016";
varreg=/\d+/g;
console.log(reg.myExecAll(str));//-->["2015","2016"]
varstr="zhufeng2015peixun2016";
varreg=/\d+?/g;
console.log(reg.myExecAll(str));//-->["2","0","1","5","2","0","1","6"]

7、分组引用

\2代表出现和第二个分组一模一样的内容

\1代表出现和第一个分组一模一样的内容

varreg=/^(\w)(\w)\2\1$/;
"woow"、"1221"...

8、字符串方法---->replace：把一个字符串中的某个字符替换成新的内容

1)在不使用正则的情况下

执行一次replace只能替换字符串中的一个，需要替换多个同样需要执行多次

varstr="zhufeng2015zhufeng2016";
"zhufeng"->"珠峰"
str=str.replace("zhufeng","珠峰").replace("zhufeng","珠峰");

有些时候即使执行多次,也实现不了替换

"zhufeng"->"zhufengpeixun"
str=str.replace("zhufeng","zhufengpeixun").replace("zhufeng","zhufengpeixun");

[第一个参数可以是一个正则]把所有和正则匹配的内容进行替换(但是和捕获一样默认是懒惰的,只有加上全局修饰符g才可以)

varstr="zhufeng2015zhufeng2016";
str=str.replace(/zhufeng/g,"zhufengpeixun");
console.log(str);

1)执行和执行次数问题

其实和exec捕获的原理是一模一样的

例如：我们第二个参数如果传递的是一个函数,每当正则在字符串中捕获一次当前的这个函数就执行一次->本题中一共捕获了两次,所以函数执行了两次

varstr="zhufeng2015zhufeng2016";
str=str.replace(/zhufeng/g,function(){

2)参数问题

console.dir(arguments);
不仅仅是执行function,而且还给我们的函数传递了参数,并且传递的参数和每一次exec捕获的内容是一模一样的
如果是第一次exec捕获->["zhufeng",index:0,input:"原始字符串"]
第一次执行函数里面的参数
arguments[0]->"zhufeng"/**/
arguments[1]->0 相当于exec中的index开始捕获的索引位置
arguments[2]->"原始字符串"相当于exec中的input

3)返回值问题

return返回的是什么,就相当于把当前捕获的内容替换成什么

return"zhufengpeixun";
});
console.log(str);

常用正则表达式知识点解读及判读有效数字、手机号邮箱正则表达式

热门推荐

随机推荐