python requests抓取one推送文字和图片代码实例
这篇文章主要介绍了pythonrequests抓取one推送文字和图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
requests是Python中一个第三方库,基于urllib,采用Apache2Licensed开源协议的HTTP库。它比urllib更加方便,可以节约我们大量的工作,完全满足HTTP测试需求。接下来将记录一下requests的使用:
frombs4importBeautifulSoup fromlxmlimporthtml importxml importrequests #下载图片函数 defdownload_img(url,name): """" 下载指定url的图片 url:图片的url; name:保存图片的名字 """ try: respone=requests.get(url) f_img=respone.content path=r'C:\Users\86131\Desktop\itchat\send_file\images\\%s.jpg'%(name) withopen(path,"wb")asf: f.write(f_img) exceptExceptionase: print("---------地址出错------------") url_list=[] f=requests.get("http://wufazhuce.com/") ##打印网页内容 #print(f.content.decode()) soup=BeautifulSoup(f.content,"lxml") try: first_div=soup.find("div",attrs={'id':'main-container'}).find('div',attrs={'class':'carousel-inner'}) a_all=first_div.find_all('a') foriina_all: url_list.append(i.attrs['href']) exceptExceptionase: print("---------出错------------") #得到one的首页推荐页面 f_1=requests.get(url_list[0]) #打印网页内容 #print(f_1.content.decode()) soup_1=BeautifulSoup(f_1.content,"lxml") try: second_div=soup_1.find("div",attrs={'id':'main-container'}).find('div',attrs={'class':'one-cita-wrapper'}) third_div=soup_1.find("div",attrs={'id':'main-container'}).find('div',attrs={'class':'one-imagen'}) #获得时期值 now_month=second_div.find('p',attrs={'class':'may'}).text now_one_day=second_div.find('p',attrs={'class':'dom'}).text #获得图片的url img_url=third_div.find('img').attrs['src'] #获得一段话并去除开头的空格 one_text=second_div.find("div",attrs={'class':'one-cita'}).text.strip() #将获得日期拼接 now_day=now_one_day+''+now_month #调用函数下载图片 download_img(img_url,now_day) exceptExceptionase: print("---------出错------------")
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。