python解析xml文件方式(解析、更新、写入)
Overview
这篇博客内容将包括对XML文件的解析、追加新元素后写入到XML,以及更新原XML文件中某结点的值。使用的是python的xml.dom.minidom包,详情可见其官方文档:xml.dom.minidom官方文档。全文都将围绕以下的customer.xml进行操作:
AcmeInc. 12345 StarWarsInc. 23456
CDATA:在XML中,不会被解析器解析的部分数据。
声明:在本文中,结点和节点被视为了同一个概念,你可以在全文的任何地方替换它,我个人感觉区别不是很大,当然,你也可以看做是我的打字输入错误。
1.解析XML文件
在解析XML时,所有的文本都是储存在文本节点中的,且该文本节点被视为元素结点的子结点,例如:2005,元素节点,拥有一个值为“2005”的文本节点,“2005”不是元素的值,最常用的方法就是getElementsByTagName()方法了,获取到结点后再进一步根据文档结构解析即可。
具体的理论就不过多描述,配合上述XML文件和下面的代码,你将清楚的看到操作方法,下面的代码执行的工作是将所有的结点名称以及结点信息输出一下:
#-*-coding:utf-8-*-
"""
@Author:LiuZhian
@Time:2019/4/240024上午9:19
@Comment:
"""
fromxml.dom.minidomimportparse
defreadXML():
domTree=parse("./customer.xml")
#文档根元素
rootNode=domTree.documentElement
print(rootNode.nodeName)
#所有顾客
customers=rootNode.getElementsByTagName("customer")
print("****所有顾客信息****")
forcustomerincustomers:
ifcustomer.hasAttribute("ID"):
print("ID:",customer.getAttribute("ID"))
#name元素
name=customer.getElementsByTagName("name")[0]
print(name.nodeName,":",name.childNodes[0].data)
#phone元素
phone=customer.getElementsByTagName("phone")[0]
print(phone.nodeName,":",phone.childNodes[0].data)
#comments元素
comments=customer.getElementsByTagName("comments")[0]
print(comments.nodeName,":",comments.childNodes[0].data)
if__name__=='__main__':
readXML()
2.写入XML文件
在写入时,我觉得可分为两种方式:
新建一个全新的XML文件
在已有XML文件基础上追加一些元素信息
至于以上两种情况,其实创建元素结点的方法类似,你必须要做的都是先创建/得到一个DOM对象,再在DOM基础上创建new一个新的结点。
如果是第一种情况,你可以通过dom=minidom.Document()来创建;如果是第二种情况,直接可以通过解析已有XML文件来得到dom对象,例如dom=parse("./customer.xml")
在具体创建元素/文本结点时,你大致会写出像以下这样的“四部曲”代码:
①创建一个新元素结点createElement()
②创建一个文本节点createTextNode()
③将文本节点挂载元素结点上
④将元素结点挂载到其父元素上。
现在,我需要新建一个customer节点,信息如下:
kavin 32467
代码如下:
defwriteXML():
domTree=parse("./customer.xml")
#文档根元素
rootNode=domTree.documentElement
#新建一个customer节点
customer_node=domTree.createElement("customer")
customer_node.setAttribute("ID","C003")
#创建name节点,并设置textValue
name_node=domTree.createElement("name")
name_text_value=domTree.createTextNode("kavin")
name_node.appendChild(name_text_value)#把文本节点挂到name_node节点
customer_node.appendChild(name_node)
#创建phone节点,并设置textValue
phone_node=domTree.createElement("phone")
phone_text_value=domTree.createTextNode("32467")
phone_node.appendChild(phone_text_value)#把文本节点挂到name_node节点
customer_node.appendChild(phone_node)
#创建comments节点,这里是CDATA
comments_node=domTree.createElement("comments")
cdata_text_value=domTree.createCDATASection("Asmallbuthealthycompany.")
comments_node.appendChild(cdata_text_value)
customer_node.appendChild(comments_node)
rootNode.appendChild(customer_node)
withopen('added_customer.xml','w')asf:
#缩进-换行-编码
domTree.writexml(f,addindent='',encoding='utf-8')
if__name__=='__main__':
writeXML()
3.更新XML文件
在更新XML时,只需先找到对应的元素结点,然后将其下的文本结点或属性取值更新即可,然后保存到文件,具体我就不多说了,代码中我将思路都注释清楚了,如下:
defupdateXML():
domTree=parse("./customer.xml")
#文档根元素
rootNode=domTree.documentElement
names=rootNode.getElementsByTagName("name")
fornameinnames:
ifname.childNodes[0].data=="AcmeInc.":
#获取到name节点的父节点
pn=name.parentNode
#父节点的phone节点,其实也就是name的兄弟节点
#可能有sibNode方法,我没试过,大家可以google一下
phone=pn.getElementsByTagName("phone")[0]
#更新phone的取值
phone.childNodes[0].data=99999
withopen('updated_customer.xml','w')asf:
#缩进-换行-编码
domTree.writexml(f,addindent='',encoding='utf-8')
if__name__=='__main__':
updateXML()
如有不对之处,还烦请指教~
补充知识:python读取xml文件内容并完成修改
我就废话不多说了,还是直接看代码吧!
importos
importxml.etree.ElementTreeasET
defchangesku(inputpath):
listdir=os.listdir(inputpath)
forfileinlistdir:
iffile.endswith('xml'):
file=os.path.join(inputpath,file)
tree=ET.parse(file)
root=tree.getroot()
forobject1inroot.findall('object'):#我要修改的元素在object里面,所以需要先找到object
forskuinobject1.findall('name'):#查找想要修改的所有同种元素
if(sku.text=='005'):#‘005'为原始的text
sku.text='008'#修改‘name'的标签值
tree.write(file,encoding='utf-8')#写进原始的xml文件,不然修改就无效,‘encoding=“utf-8”'避免原始xml#中文字符乱码
else:
pass
else:
pass
if__name__=='__main__':
inputpath='D:\\easy\\hebing_xml'#这是xml文件的文件夹的绝对地址
changesku(inputpath)
以上这篇python解析xml文件方式(解析、更新、写入)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。