Python3 xml.etree.ElementTree支持的XPath语法详解
xml.etree.ElementTree可以通过支持的有限的XPath表达式来定位元素。
语法
ElementTree支持的语法如下:
说明
查找所有具有指定名称tag的子元素。例如:country表示所有名为country的元素,country/rank表示所有名为country的元素下名为rank的元素。
查找所有元素。如:*/rank表示所有名为rank的孙子元素。
选择当前元素。在xpath表达式开头使用,表示相对路径。
选择当前元素下所有级别的所有子元素。xpath不能以“//”开头。
选择父元素。如果视图达到起始元素的祖先,则返回None(或空列表)。起始元素为调用find(或findall)的元素。
选择具有指定属性attrib的所有子元素。
选择指定属性attrib具有指定值value的元素,该值不能包含引号。
选择所有具有名为tag的子元素的元素。
Python3.7+,选择元素(或其子元素)完整文本内容为指定的值text的元素。
选择元素(或其子元素)名为tag,完整文本内容为指定的值text的元素。
选择位于给定位置的所有元素,position可以是以1为起始的整数、表达式last()或相对于最后一个位置的位置(如:last()-1)
方括号表达式前面必须有标签名、星号或者其他方括号表达式。position前必须有一个标签名。
简单示例
#!/usr/bin/python #-*-coding:utf-8-*- importos importxml.etree.cElementTreeasET xml_string="""""" root=ET.fromstring(xml_string) #查找data下所有名为country的元素 forcountryinroot.findall("country"): print("name:"+country.get("name")) #查找country下所有名为year的元素 year=country.find("./year") ifyear: print("year:"+year.text) #查找名为neighbor的孙子元素 forneighborinroot.findall("*/neighbor"): print("neighbor:"+neighbor.get("name")) #查找country下的所有子元素 foreleinroot.findall("country//"): print(ele.tag) #查找当前元素的父元素,结果为空 print(root.findall("..")) #查找与名为rank的孙子元素同级的名为gdppc的元素 forgdppcinroot.findall("*/rank/../gdppc"): print("gdppc:"+gdppc.text) #查找data下所有具有name属性的子元素 forcountryinroot.findall("*[@name]"): print(country.get("name")) #查找neighbor下所有具有name属性的子元素 forneighborinroot.findall("country/*[@name]"): print(neighbor.get("name")) #查找country下name属性值为Malaysia的子元素 print("direction:"+root.find("country/*[@name='Malaysia']").get("direction")) #查找root下所有包含名为year的子元素的元素 forcountryinroot.findall("*[year]"): print("name:"+country.get("name")) #查找元素(或其子元素)文本内容为2011的元素(Python3.7+) #print(len(root.findall("*[.='2011']"))) #查找元素(或其子元素)名为gdppc,文本内容为2011的元素 foreleinroot.findall("*[gdppc='2011']"): print(ele.get("name")) #查找第二个country元素 print(root.find("country[2]").get("name")) 2 2008 141100 5 2011 59900 69 2011 2011 55 13600
补充知识:pythonlxmletreexpath定位
etree全称:ElementTree元素树
用法:
importrequests fromlxmlimportetree response=requests.get('html') res=etree.HTML(response.text)#利用etree.HTML初始化网页内容 resp=res.xpath('//span[@class="green"]/text()')
以上这篇Python3xml.etree.ElementTree支持的XPath语法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。