Java 使用正则表达式对象实现正则的获取功能
获取需要使用到正则的两个对象:
使用的是用正则对象Pattern和匹配器Matcher。
用法:
范例:
Patternp=Pattern.compile("a*b");
Matcherm=p.matcher("aaaaab");
booleanb=m.matches();
步骤:
1,先将正则表达式编译成正则对象。使用的是Pattern类一个静态的方法。compile(regex);
2,让正则对象和要操作的字符串相关联,通过matcher方法完成,并返回匹配器对象。
3,通过匹配器对象的方法将正则模式作用到字符串上对字符串进行针对性的功能操作
需求:获取由3个字母组成的单词。
publicstaticvoidgetDemo()
{
Stringstr="dajiazhuyile,mingtianbufangjia,xiexie!";
//想要获取由3个字母组成的单词。
//刚才的功能返回的都是一个结果,只有split返回的是数组,但是它是把规则作为分隔符,不会获取符合规则的内容。
//这时我们要用到一些正则对象。
Stringreg="\\b[a-z]{3}\\b";
Patternp=Pattern.compile(reg);
Matcherm=p.matcher(str);
while(m.find())
{
System.out.println(m.start()+"...."+m.end());
System.out.println("sub:"+str.substring(m.start(),m.end()));
System.out.println(m.group());
}
//System.out.println(m.find());//将规则对字符串进行匹配查找。
//System.out.println(m.find());//将规则对字符串进行匹配查找。
//System.out.println(m.group());//在使用group方法之前,必须要先找,找到了才可以取。
}
校验邮件
publicstaticvoidcheckMail()
{
Stringmail="abc123@sina.com.cn";
mail="1@1.1";
Stringreg="[a-zA-Z_0-9]+@[a-zA-Z0-9]+(\\.[a-zA-Z]+)+";
reg="\\w+@\\w+(\\.\\w+)+";//简化的规则。笼统的匹配。
booleanb=mail.matches(reg);
System.out.println(mail+":"+b);
}
网络爬虫(获取邮箱)
classGetMailList
{
publicstaticvoidmain(String[]args)throwsException
{
Stringreg="\\w+@[a-zA-Z]+(\\.[a-zA-Z]+)+";
getMailsByWeb(reg);
}
publicstaticvoidgetMailsByWeb(Stringregex)throwsException
{
URLurl=newURL("http://localhost:8080/myweb/mail.html");
URLConnectionconn=url.openConnection();
BufferedReaderbufIn=newBufferedReader(newInputStreamReader(conn.getInputStream()));
Stringline=null;
Patternp=Pattern.compile(regex);
while((line=bufIn.readLine())!=null)
{
//System.out.println(line);
Matcherm=p.matcher(line);
while(m.find())
{
System.out.println(m.group());
}
}
bufIn.close();
}
publicstaticvoidgetMails(Stringregex)throwsException
{
BufferedReaderbufr=
newBufferedReader(newFileReader("mail.txt"));
Stringline=null;
Patternp=Pattern.compile(regex);
while((line=bufr.readLine())!=null)
{
//System.out.println(line);
Matcherm=p.matcher(line);
while(m.find())
{
System.out.println(m.group());
}
}
bufr.close();
}
}
单词边界匹配器\b
\b代表一个单词的开始和结束部分,不匹配任何字符
总结
以上所述是小编给大家介绍的Java使用正则表达式对象实现正则的获取功能,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对毛票票网站的支持!