简单介绍使用Python解析并修改XML文档的方法
问题
你想读取一个XML文档,对它最一些修改,然后将结果写回XML文档。
解决方案
使用xml.etree.ElementTree模块可以很容易的处理这些任务。第一步是以通常的方式来解析这个文档。例如,假设你有一个名为pred.xml的文档,类似下面这样:
下面是一个利用ElementTree来读取这个文档并对它做一些修改的例子:
>>>fromxml.etree.ElementTreeimportparse,Element
>>>doc=parse('pred.xml')
>>>root=doc.getroot()
>>>root
<Element'stop'at0x100770cb0>
>>>#Removeafewelements
>>>root.remove(root.find('sri'))
>>>root.remove(root.find('cr'))
>>>#Insertanewelementafter<nm>...</nm>
>>>root.getchildren().index(root.find('nm'))
1
>>>e=Element('spam')
>>>e.text='Thisisatest'
>>>root.insert(2,e)
>>>#Writebacktoafile
>>>doc.write('newpred.xml',xml_declaration=True)
>>>
处理结果是一个像下面这样新的XML文件:
讨论
修改一个XML文档结构是很容易的,但是你必须牢记的是所有的修改都是针对父节点元素,将它作为一个列表来处理。例如,如果你删除某个元素,通过调用父节点的remove()方法从它的直接父节点中删除。如果你插入或增加新的元素,你同样使用父节点元素的insert()和append()方法。还能对元素使用索引和切片操作,比如element[i]或element[i:j]
如果你需要创建新的元素,可以使用本节方案中演示的Element类。我们在6.5小节已经详细讨论过了。