python操作xml文件详细介绍
关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码。这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python来读取xml文件。
一、什么是xml?
xml即可扩展标记语言,它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。
abc.xml
<?xmlversion="1.0"encoding="utf-8"?>
<catalog>
<maxid>4</maxid>
<loginusername="pytest"passwd='123456'>
<caption>Python</caption>
<itemid="4">
<caption>测试</caption>
</item>
</login>
<itemid="2">
<caption>Zope</caption>
</item>
</catalog>
Ok,从结构上,它很像我们常见的HTML超文本标记语言。但他们被设计的目的是不同的,超文本标记语言被设计用来显示数据,其焦点是数据的外观。它被设计用来传输和存储数据,其焦点是数据的内容。
那么它有如下特征:
首先,它是有标签对组成,<aa></aa>
标签可以有属性:<aaid='123'></aa>
标签对可以嵌入数据:<aa>abc</aa>
标签可以嵌入子标签(具有层级关系):
二、获得标签属性
那么,下面来介绍如何用python来读取这种类型的文件。
#coding=utf-8 import xml.dom.minidom
#打开xml文档 dom=xml.dom.minidom.parse('abc.xml')
#得到文档元素对象 root=dom.documentElement printroot.nodeName printroot.nodeValue printroot.nodeType printroot.ELEMENT_NODE