java在网页上面抓取邮件地址的方法
本文实例讲述了java在网页上面抓取邮件地址的方法。分享给大家供大家参考。具体实现方法如下:
importjava.io.BufferedReader;
importjava.io.InputStreamReader;
importjava.net.URL;
importjava.util.regex.Matcher;
importjava.util.regex.Pattern;
publicclassh1
{
publicstaticString getWebCon(Stringdomain)
{
System.out.println("开始抓取邮件地址..("+domain+")");
StringBuffersb=newStringBuffer();
try
{
java.net.URLurl=newjava.net.URL(domain);
BufferedReaderin=newBufferedReader(newInputStreamReader(url.openStream()));
Stringline;
while((line=in.readLine())!=null)
{
parse(line);
}
in.close();
}
catch(Exceptione)
{
sb.append(e.toString());
System.err.println(e);
}
returnsb.toString();
}
publicstaticvoidmain(String[]args)
{
Strings;
s=h1.getWebCon("http://post.baidu.com/f?kz=34942387");//这是要抓取的网页,自己可以试下.
//System.out.println(s);
}
privatestaticvoidparse(Stringline)
{
Patternp=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");//邮箱的正则表达式
Matcherm=p.matcher(line);
while(m.find())
{
System.out.println(m.group());
}
}
}
希望本文所述对大家的Java程序设计有所帮助。