javascript学习笔记(八)正则表达式
基本概念
正则表达式是一种文本模式,包括普通字符(例如,a到z之间的字母)和特殊字符(称为“元字符”)。模式描述在搜索文本时要匹配的一个或多个字符串。
首先推荐几个正则表达式编辑器
Debuggex:https://www.debuggex.com/
PyRegex:http://www.pyregex.com/
Regexper:http://www.regexper.com/
正则表达式是一种查找以及字符串替换操作。正则表达式在文本编辑器中广泛使用,比如正则表达式被用于:
[copy]检查文本中是否含有指定的特征词
找出文中匹配特征词的位置
从文本中提取信息,比如:字符串的子串
修改文本
说明:正则表达式通常用于两种任务:1.验证,2.搜索/替换。用于验证时,通常需要在前后分别加上^和$,以匹配整个待验证字符串;搜索/替换时是否加上此限定则根据搜索的要求而定,此外,也有可能要在前后加上\b而不是^和$。此表所列的常用正则表达式,除个别外均未在前后加上任何限定,请根据需要,自行处理。
优先权顺序
在构造正则表达式之后,就可以象数学表达式一样来求值,也就是说,可以从左至右并按照一个优先权顺序来求值。下表从最高优先级到最低优先级列出各种正则表达式操作符的优先权顺序:
操作符 | 描述 |
---|---|
\ | 转义符 |
(),(?:),(?=),[] | 圆括号和方括号 |
*,+,?,{n},{n,},{n,m} | 限定符 |
^,$,\anymetacharacter | 位置和顺序 |
建立正则表达式
构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与操作符将小的表达式结合在一起来创建更大的表达式。
可以通过在一对分隔符之间放入表达式模式的各种组件来构造一个正则表达式。
对JScript而言,分隔符为一对正斜杠(/)字符。例如:
/expression/
对VBScript而言,则采用一对引号("")来确定正则表达式的边界。例如:
"expression"
看个例子
//匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线
varre=newRegExp("^[a-zA-Z][a-zA-Z0-9_]{5,19}$"); if(re.test(aaaa)){ alert("格式正确"); }else{ alert("格式错误"); }