如何使用Python抓取网页tag操作
这篇文章主要介绍了如何使用Python抓取网页tag操作,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
1.获取操作tag
- 获取操作tag的接种方式:
- soup.find_all(name=None,attrs={},recursive=True,text=None,limit=None,**kwargs),返回符合条件的所有标签,查找不到则返回[],可以传递标签名,标签属性,关键字参数,函数,True等
- soup.find(name=None,attrs={},recursive=True,text=None,**kwargs),返回第一个符合条件的标签,查找不到则返回None
- soup.select(selector,_candidate_generator=None,limit=None),根据css选择器返回所有符合条件的标签
- soup.select_one(selector),返回符合css选择器的第一个标签
2.操作tag
- tag.name,获取标签名,例如:'div'
- tag['attr_name'],获取标签的某个属性的值,string类型
- tag['class'],获取标签的class属性值,list类型,例如:['orange','login']
- tag.attrs,获取标签的所有属性,dict类型
- tag.get_text(),返回标签的内容,或者tag.text
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。