Scrapy的remove_tags_with_content方法无法删除img标签?
Scrapy爬取的数据有时候会做清理,把不需要用的标签都清除掉。
其中remove_tags和remove_tags_with_content是比较有用的内置方法。
一个是去除标签本身,一个是去除标签及标签中的内容。
使用方式:
fromscrapy.utils.markupimportremove_tags,remove_tags_with_content
content=remove_tags(content,('a',))
content=remove_tags_with_content(content,('script','iframe'))
那么,如果是要删除img标签,该用哪一个呢?
刚开始的时候我用了remove_tags_with_content,一直不凑效,折腾。
后来转念一想,img标签只有标签,并没有像div、a、p等标签,里面还有内容。
所以改用remove_tags就行了!!!
热门推荐
10 八一幼儿祝福语大全简短
11 公司乔迁食堂祝福语简短
12 婚礼结束聚餐祝福语简短
13 儿媳买车妈妈祝福语简短
14 毕业送礼老师祝福语简短
15 同事辞职正常祝福语简短
16 恭贺新婚文案祝福语简短
17 金店立秋祝福语简短英文
18 婆婆高寿祝福语大全简短