详解Linux中正则表达式的应用
1、组成
普通字符:普通字符串,没有特殊含义
特殊字符:在正则表达式中具有特殊的含义
正则表达式中常见的meta字符【特殊字符】
2、POSIXBRE【基本】与ERE【扩展】中都有的meta字符
\:通常用于打开或关闭后续字符的特殊含义,如(...)【\是转义字符,去掉符号的特殊意义,()、{}等在shell中都有特殊的意义】
.和以及.的区别:
[root@localhost~]#cat-ntest.txt
1 gd
2 god
3
4 good
5 goood
6 goad
7
8 gboad
2.1、.:匹配任意单个字符(除null,即不能为空)
[root@localhost~]#grep-n"."test.txt
1:gd
2:god
4:good
5:goood
6:goad
8:gboad
[root@localhost~]#grep-n"go.d"test.txt
4:good
6:goad
2.2、:匹配其前字符任意次,如o,可以是没有o或者一个o,也可以是多个o
[root@localhost~]#grep-n"*"test.txt
[root@localhost~]#grep-n"o*"test.txt
1:gd
2:god
3:
4:good
5:goood
6:goad
7:
8:gboad
[root@localhost~]#echo"gbad">>test.txt
[root@localhost~]#echo"pbad">>test.txt
[root@localhost~]#echo"kgbad">>test.txt
[root@localhost~]#echo"poad">>test.txt
[root@localhost~]#grep-n"go*"test.txt【o可以没有,o前面的g一定要匹配】
1:gd
2:god
4:good
5:goood
6:goad
8:gboad
9:gbad
11:kgbad
*2.3、.:匹配任意字符(匹配所有),可以为空**
[root@localhost~]#grep-n".*"test.txt
1:gd
2:god
3:
4:good
5:goood
6:goad
7:
8:gboad
9:gbad
10:pbad
11:kgbad
12:poad
[root@localhost~]#grep-n"go.*"test.txt
2:god
4:good
5:goood
6:goad
[root@localhost~]#grep-n"po.*"test.txt
12:poad
[root@localhost~]#echo"pgoad">>test.txt
[root@localhost~]#grep-n"go.*"test.txt 【匹配go后存在任意字符,可为空】
2:god
4:good
5:goood
6:goad
13:pgoad
[root@localhost~]#
[root@localhost~]#grep-n"o.*"test.txt
2:god
4:good
5:goood
6:goad
8:gboad
12:poad
2.4、^:匹配紧接着后面的正则表达式,以...为开头
[root@localhosttmp]#grep"^root"/etc/passwd
root:x:0:0:root:/root:/bin/bash
[root@localhosttmp]#
2.5、$:匹配紧接着前面的正则表达式,以...结尾
[root@localhosttmp]#grep"bash$"/etc/passwd|head-1
root:x:0:0:root:/root:/bin/bash
[root@localhosttmp]#
^$:表示是空行的意思
“#|^$”:匹配以#号开头的注释行和空行
2.6、[]:匹配方括号里的任一字符
(如[sS],匹配s或匹配S),其中可用连字符(-)指定连字符的范围(如[(0-9)],匹配0-9任一字符);[^0-9]如果^符号出现在方括号的第一个位置,则表示匹配不在列表中的任一字符。
[root@localhosttmp]#cathosts
192.168.200.1
192.168.200.3
a.b.123.5
23.c.56.1
1456.1.2.4
12.4.5.6.8
[root@localhosttmp]#grep-E'([0-9]{1,3}\.){3}[0-9]{1,3}'hosts
192.168.200.1
192.168.200.3
1456.1.2.4
12.4.5.6.8
[root@localhosttmp]#grep-E'^([0-9]{1,3}\.){3}[0-9]{1,3}$'hosts
192.168.200.1
192.168.200.3
[root@localhosttmp]#
2.7、?:匹配前面字符的零次或多次
[root@localhost~]#grep-E"go?d"test.txt
gd
god
[root@localhost~]#
[root@localhosttmp]#cattest
do
does
doxy
[root@localhosttmp]#grep-E"do(es)?"test
do
does
doxy
[root@localhosttmp]#
3、POSIXBRE(基本正则)中才有的字符
{n,m}:区间表达式,匹配在它前面的单个字符重现【重复,紧接着的单个字符如https{0,1},即重复s0-1次。{n}指匹配n次;{n,m}指匹配n至m次,{n,}指匹配至少n次,{,m}匹配至多m次。【\转义字符】
4、POSIXERE(扩展正则)中才有的字符
4.1、{n,m}:与BRE的{n,m}功能相同
[root@localhosttmp]#grep-E'^([0-9]{1,3}\.){3}[0-9]{1,3}$'hosts
192.168.200.1
192.168.200.3
4.2、+:匹配前面正则表达式的一次或多次
[root@localhost~]#egrep"go+d"test.txt
god
good
goood
[root@localhost~]#
4.3、|:表示匹配多个字符串【或的关系】
[root@localhost~]#grep-E"3306|1521"/etc/services
mysql 3306/tcp #MySQL
mysql 3306/udp #MySQL
ncube-lm 1521/tcp #nCubeLicenseManager
ncube-lm 1521/udp #nCubeLicenseManager
[root@localhost~]#
4.4、():分组过滤,后向引用
分组过滤
[root@localhost~]#echo"glad">>test.txt
[root@localhost~]#egrep"(la|oo)"test.txt
good
goood
glad
()后向引用;当前面匹配部分用小括号的时候,第一个括号的内容可以在后面部分用\1输出;以此类推。
[root@localhosttmp]#ifconfig|sed-rn's#.*addr:(.*)(B.*)$#\1#gp'
192.168.4.27
5、正则表达式的元字符
5.1、\b:匹配一个单词边界
[root@localhosttmp]#cattest
do
does
doxy
agdoeg
[root@localhosttmp]#grep"do\b"test
do
[root@localhosttmp]#grep"\bdo"test
do
does
doxy
[root@localhosttmp]#grep"\bdoes"test
does
[root@localhosttmp]#grep"\bdo\b"test
do
[root@localhosttmp]#
5.2、\B:匹配非单词边界,与\b相反
[root@localhosttmp]#grep"do\B"test
does
doxy
agdoeg
[root@localhosttmp]#grep"do\b"test
do
[root@localhosttmp]#
5.3、\d:匹配一个数字字符,等价于[0-9]
5.4、\D:匹配一个非数字字符,等价于[^0-9]
5.5、\w:匹配字母、数字、下划线,等价于[A-Za-z0-9_]
还有很多元字符,这里就不一一罗列出来
案例:开机精简
[root@localhost~]#chkconfig--list|egrep-v"crond|network|rsyslog|sshd|sysstat"|awk'{print"chkconfig",$1,"off"}'|bash