python爬虫入门教程之点点美女图片爬虫代码分享
继续鼓捣爬虫,今天贴出一个代码,爬取点点网「美女」标签下的图片,原图。
#-*-coding:utf-8-*-
#---------------------------------------
#程序:点点美女图片爬虫
#版本:0.2
#作者:zippera
#日期:2013-07-26
#语言:Python2.7
#说明:能设置下载的页数
#---------------------------------------
importurllib2
importurllib
importre
pat=re.compile('<divclass="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1="http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
count=1
whilecount<2:
print"Page"+str(count)+"\n"
myurl=nexturl1+str(count)
myres=urllib2.urlopen(myurl)
mypage=myres.read()
ucpage=mypage.decode("utf-8")#转码
mat=pat.findall(ucpage)
iflen(mat):
cnt=1
foriteminmat:
print"Page"+str(count)+"No."+str(cnt)+"url:"+item+"\n"
cnt+=1
fnp=re.compile('(\w{10}\.\w+)$')
fnr=fnp.findall(item)
iffnr:
fname=fnr[0]
urllib.urlretrieve(item,fname)
else:
print"nodata"
count+=1
使用方法:新建一个文件夹,把代码保存为name.py文件,运行pythonname.py就可以把图片下载到文件夹。