node.js正则表达式获取网页中所有链接的代码实例
实现代码
varhttp=require('http');
//定义函数 vargetAHref=function(htmlstr){ varreg=/<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim; vararr=[]; while(tem=reg.exec(htmlstr)){ arr.push(tem[2]); } returnarr; }
varqHref="http://xxx";//设置被查询的目标网址 varreq=http.get(qHref,function(res){ varpageData=""; res.setEncoding('utf8'); res.on('error',function(errget){ //出错处理 }); res.on('data',function(chunk){ pageData+=chunk; });
res.on('end',function(){ //console.dir(pageData); varcontent=pageData;//获取到网页内容 varhrefs=getAHref(content);//获取链接
});
});
热门推荐
10 八一幼儿祝福语大全简短
11 公司乔迁食堂祝福语简短
12 婚礼结束聚餐祝福语简短
13 儿媳买车妈妈祝福语简短
14 毕业送礼老师祝福语简短
15 同事辞职正常祝福语简短
16 恭贺新婚文案祝福语简短
17 金店立秋祝福语简短英文
18 婆婆高寿祝福语大全简短