python requests抓取one推送文字和图片代码实例
这篇文章主要介绍了pythonrequests抓取one推送文字和图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
requests是Python中一个第三方库,基于urllib,采用Apache2Licensed开源协议的HTTP库。它比urllib更加方便,可以节约我们大量的工作,完全满足HTTP测试需求。接下来将记录一下requests的使用:
frombs4importBeautifulSoup
fromlxmlimporthtml
importxml
importrequests
#下载图片函数
defdownload_img(url,name):
""""
下载指定url的图片
url:图片的url;
name:保存图片的名字
"""
try:
respone=requests.get(url)
f_img=respone.content
path=r'C:\Users\86131\Desktop\itchat\send_file\images\\%s.jpg'%(name)
withopen(path,"wb")asf:
f.write(f_img)
exceptExceptionase:
print("---------地址出错------------")
url_list=[]
f=requests.get("http://wufazhuce.com/")
##打印网页内容
#print(f.content.decode())
soup=BeautifulSoup(f.content,"lxml")
try:
first_div=soup.find("div",attrs={'id':'main-container'}).find('div',attrs={'class':'carousel-inner'})
a_all=first_div.find_all('a')
foriina_all:
url_list.append(i.attrs['href'])
exceptExceptionase:
print("---------出错------------")
#得到one的首页推荐页面
f_1=requests.get(url_list[0])
#打印网页内容
#print(f_1.content.decode())
soup_1=BeautifulSoup(f_1.content,"lxml")
try:
second_div=soup_1.find("div",attrs={'id':'main-container'}).find('div',attrs={'class':'one-cita-wrapper'})
third_div=soup_1.find("div",attrs={'id':'main-container'}).find('div',attrs={'class':'one-imagen'})
#获得时期值
now_month=second_div.find('p',attrs={'class':'may'}).text
now_one_day=second_div.find('p',attrs={'class':'dom'}).text
#获得图片的url
img_url=third_div.find('img').attrs['src']
#获得一段话并去除开头的空格
one_text=second_div.find("div",attrs={'class':'one-cita'}).text.strip()
#将获得日期拼接
now_day=now_one_day+''+now_month
#调用函数下载图片
download_img(img_url,now_day)
exceptExceptionase:
print("---------出错------------")
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。