Java使用正则表达式获取子文本的方法示例
本文实例讲述了Java使用正则表达式获取子文本的方法。分享给大家供大家参考,具体如下:
原来,group是针对()来说的,group(0)就是指的整个串,group(1)指的是第一个括号里的东西,group(2)指的第二个括号里的东西。
最近学习正则表达式,发现Java中的一些术语与其他地方描述的有所差异。就这个问题卡了我半天,坑爹,写到博客,方便其他新学的朋友。比如Java正则表达式中的“组”概念与《正则表达式必知必会》一书中讲述的“子表达式”其实是一样的,只是表述不同而已。由此也引发了使用JavaAPI时对group(intgroup)、start(intgroup)、end(intgroup)不是太理解。
程序如下
packagecn.mingyuan.regexp.singlecharacter; importjava.util.regex.Matcher; importjava.util.regex.Pattern; publicclassGroupIndexAndStartEndIndexTest{ /** *@paramargs */ publicstaticvoidmain(String[]args){ //TODOAuto-generatedmethodstub Stringstr="Hello,World!inJava."; Patternpattern=Pattern.compile("W(or)(ld!)"); Matchermatcher=pattern.matcher(str); while(matcher.find()){ System.out.println("Group0:"+matcher.group(0));//得到第0组——整个匹配 System.out.println("Group1:"+matcher.group(1));//得到第一组匹配——与(or)匹配的 System.out.println("Group2:"+matcher.group(2));//得到第二组匹配——与(ld!)匹配的,组也就是子表达式 System.out.println("Start0:"+matcher.start(0)+"End0:"+matcher.end(0));//总匹配的索引 System.out.println("Start1:"+matcher.start(1)+"End1:"+matcher.end(1));//第一组匹配的索引 System.out.println("Start2:"+matcher.start(2)+"End2:"+matcher.end(2));//第二组匹配的索引 System.out.println(str.substring(matcher.start(0),matcher.end(1)));//从总匹配开始索引到第1组匹配的结束索引之间子串——Wor } } }
程序的运行结果为:
Group0:World! Group1:or Group2:ld! Start0:6End0:12 Start1:7End1:9 Start2:9End2:12 Wor
总结:其实group(),start(),end()所带的参数i就是正则表达式中的子表达式索引(第几个子表达式),由于刚开始对Java正则表达式中的组的概念不清晰,导致理解困难。当将“组”的概念与“子表达式”对应起来之后,理解matcher的group,start,end就完全没有障碍了。
PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:
JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript
正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg
更多关于java算法相关内容感兴趣的读者可查看本站专题:《Java正则表达式技巧大全》、《Java数据结构与算法教程》、《Java操作DOM节点技巧总结》、《Java文件与目录操作技巧汇总》和《Java缓存操作技巧汇总》
希望本文所述对大家java程序设计有所帮助。