python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据示例
本文实例讲述了python3BeautifulSoup模块使用字典的方法抓取a标签内的数据。分享给大家供大家参考,具体如下:
#-*-coding:utf-8-*- #python2.7 #XiaoDeng #http://tieba.baidu.com/p/2460150866 #标签操作 frombs4importBeautifulSoup importurllib.request importre #如果是网址,可以用这个办法来读取网页 #html_doc="http://tieba.baidu.com/p/2460150866" #req=urllib.request.Request(html_doc) #webpage=urllib.request.urlopen(req) #html=webpage.read() html="""TheDormouse'sstory TheDormouse'sstory Onceuponatimetherewerethreelittlesisters;andtheirnameswere , Lacieand Tillie; Lacie andtheylivedatthebottomofawell. ... """ soup=BeautifulSoup(html,'html.parser')#文档对象 #查找a标签,只会查找出一个a标签 #print(soup.a)# forkinsoup.find_all('a'): print(k) print(k['class'])#查a标签的class属性 print(k['id'])#查a标签的id值 print(k['href'])#查a标签的href值 print(k.string)#查a标签的string #如果,标签中含有其他标签,比如..,此时要提取中的数据,需要用k.get_text() #tag.get('calss'),也可以达到这个效果 PythonSocket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》
更多关于Python相关内容可查看本站专题:《
希望本文所述对大家Python程序设计有所帮助。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。