Python3 xml.etree.ElementTree支持的XPath语法详解

2023-07-29 16:53:03 422

xml.etree.ElementTree可以通过支持的有限的XPath表达式来定位元素。

语法

ElementTree支持的语法如下：

语法说明 tag 查找所有具有指定名称tag的子元素。例如：country表示所有名为country的元素，country/rank表示所有名为country的元素下名为rank的元素。 * 查找所有元素。如：*/rank表示所有名为rank的孙子元素。 . 选择当前元素。在xpath表达式开头使用，表示相对路径。 // 选择当前元素下所有级别的所有子元素。xpath不能以“//”开头。 .. 选择父元素。如果视图达到起始元素的祖先，则返回None（或空列表）。起始元素为调用find（或findall）的元素。 [@attrib] 选择具有指定属性attrib的所有子元素。 [@attrib='value'] 选择指定属性attrib具有指定值value的元素，该值不能包含引号。 [tag] 选择所有具有名为tag的子元素的元素。 [.='text'] Python3.7+，选择元素（或其子元素）完整文本内容为指定的值text的元素。 [tag='text'] 选择元素（或其子元素）名为tag，完整文本内容为指定的值text的元素。 [position] 选择位于给定位置的所有元素，position可以是以1为起始的整数、表达式last()或相对于最后一个位置的位置（如：last()-1）

方括号表达式前面必须有标签名、星号或者其他方括号表达式。position前必须有一个标签名。

简单示例

#！/usr/bin/python
#-*-coding:utf-8-*-
importos
importxml.etree.cElementTreeasET
xml_string="""


2
2008
141100




5
2011
59900



69
2011
2011



	
55
13600


"""
root=ET.fromstring(xml_string)
#查找data下所有名为country的元素
forcountryinroot.findall("country"):
	print("name:"+country.get("name"))
	#查找country下所有名为year的元素
	year=country.find("./year")
	ifyear:
		print("year:"+year.text)
#查找名为neighbor的孙子元素
forneighborinroot.findall("*/neighbor"):
	print("neighbor:"+neighbor.get("name"))
#查找country下的所有子元素
foreleinroot.findall("country//"):
	print(ele.tag)
#查找当前元素的父元素，结果为空
print(root.findall(".."))
#查找与名为rank的孙子元素同级的名为gdppc的元素
forgdppcinroot.findall("*/rank/../gdppc"):
	print("gdppc:"+gdppc.text)
#查找data下所有具有name属性的子元素
forcountryinroot.findall("*[@name]"):
	print(country.get("name"))
#查找neighbor下所有具有name属性的子元素
forneighborinroot.findall("country/*[@name]"):
	print(neighbor.get("name"))
#查找country下name属性值为Malaysia的子元素
print("direction:"+root.find("country/*[@name='Malaysia']").get("direction"))
#查找root下所有包含名为year的子元素的元素
forcountryinroot.findall("*[year]"):
	print("name:"+country.get("name"))
#查找元素（或其子元素）文本内容为2011的元素（Python3.7+）
#print(len(root.findall("*[.='2011']")))
#查找元素（或其子元素）名为gdppc，文本内容为2011的元素
foreleinroot.findall("*[gdppc='2011']"):
	print(ele.get("name"))
#查找第二个country元素
print(root.find("country[2]").get("name"))

补充知识：pythonlxmletreexpath定位

etree全称：ElementTree元素树

用法：

importrequests
fromlxmlimportetree
response=requests.get('html')
res=etree.HTML(response.text)#利用etree.HTML初始化网页内容
resp=res.xpath('//span[@class="green"]/text()')

以上这篇Python3xml.etree.ElementTree支持的XPath语法详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持毛票票。

声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：czq8825#qq.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

Python3 xml.etree.ElementTree支持的XPath语法详解

热门推荐

随机推荐