Python lxml解析HTML并用xpath获取元素的方法
代码
使用方法见注释
#-*-coding:UTF-8-*- fromlxmlimportetree source=u'''测试数据1 测试数据2 测试数据3
图片 ''' #从字符串解析 page=etree.HTML(source) #元素列表 ps=page.xpath("//p") forpinps: printu"属性:%s"%p.attrib printu"文本:%s"%p.text #文本列表 ts=page.xpath("//p/text()") fortints: printt #xpath定位 ls=page.xpath('//p[@class="p1"][last()]/img') forlinls: printl.attrib以上这篇Pythonlxml解析HTML并用xpath获取元素的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。