一 、python模塊 xml.dom 解析XML的API
minidom.parse(filename)
加載讀取XML文件
doc.documentElement
獲取XML文檔對象
node.getAttribute(AttributeName)
獲取XML節點屬性值
node.getElementsByTagName(TagName)
獲取XML節點對象集合
node.childNodes #返回子節點列表。
node.childNodes[index].nodeValue
獲取XML節點值
node.firstChild
#訪問第一個節點。等價于pagexml.childNodes[0]
doc = minidom.parse(filename)
doc.toxml('UTF-8')
返回Node節點的xml表示的文本
Node.attributes["id"]
a.name #就是上面的 "id"
a.value #屬性的值
訪問元素屬性
二、python解析xml文件的實例代碼
1、創建user.xml文件,添加XMl節點
<?xml version="1.0" encoding="UTF-8" ?>
<users>
<user id="1000001">
<username>Admin</username>
<email>admin@live.cn</email>
<age>23</age>
<sex>男</sex>
</user>
<user id="1000002">
<username>Admin2</username>
<email>admin2@live.cn</email>
<age>22</age>
<sex>男</sex>
</user>
<user id="1000003">
<username>Admin3</username>
<email>admin3@live.cn</email>
<age>27</age>
<sex>男</sex>
</user>
<user id="1000004">
<username>Admin4</username>
<email>admin4@live.cn</email>
<age>25</age>
<sex>女</sex>
</user>
<user id="1000005">
<username>Admin5</username>
<email>admin5@live.cn</email>
<age>20</age>
<sex>男</sex>
</user>
<user id="1000006">
<username>Admin6</username>
<email>admin6@live.cn</email>
<age>23</age>
<sex>女</sex>
</user>
</users>
2、Demo.py解析user.xml文檔數據
# -*- coding:utf-8 -*-
"""
* User: lhj588
* Date: 11-11-9
* Time: 13:20
* Desc:
"""
from xml.dom import minidom
def get_attrvalue(node, attrname):
return node.getAttribute(attrname) if node else ''
def get_nodevalue(node, index = 0):
return node.childNodes[index].nodeValue if node else ''
def get_xmlnode(node,name):
return node.getElementsByTagName(name) if node else []
def xml_to_string(filename='user.xml'):
doc = minidom.parse(filename)
return doc.toxml('UTF-8')
def get_xml_data(filename='user.xml'):
doc = minidom.parse(filename)
root = doc.documentElement
user_nodes = get_xmlnode(root,'user')
user_list=[]
for node in user_nodes:
user_id = get_attrvalue(node,'id')
node_name = get_xmlnode(node,'username')
node_email = get_xmlnode(node,'email')
node_age = get_xmlnode(node,'age')
node_sex = get_xmlnode(node,'sex')
user_name =get_nodevalue(node_name[0]).encode('utf-8','ignore')
user_email = get_nodevalue(node_email[0]).encode('utf-8','ignore')
user_age = int(get_nodevalue(node_age[0]))
user_sex = get_nodevalue(node_sex[0]).encode('utf-8','ignore')
user = {}
user['id'] , user['username'] , user['email'] , user['age'] , user['sex'] = (
int(user_id), user_name , user_email , user_age , user_sex
)
user_list.append(user)
return user_list
def test_xmltostring():
print xml_to_string()
def test_laod_xml():
user_list = get_xml_data()
for user in user_list :
#print user['sex']
print '-----------------------------------------------------'
if user:
user_str='編 號:%d/n用戶名:%s/n性 別:%s/n年 齡:%s/n郵 箱:%s/n ' % (int(user['id']) , user['username'], user['sex'] , user['age'] , user['email'])
print user_str
print '====================================================='
if __name__ == "__main__":
test_xmltostring()
test_laod_xml()
3、測試效果
A、測試toxml
demo.py 文件中修改成
if __name__ == "__main__":
test_xmltostring()
本節是 python 解析XML python模塊xml.dom解析xml實例 第二部分的內容。
執行打印結果:
<user id="1000001">
<username>Admin</username>
<email>admin@live.cn</email>
<age>23</age>
<sex>男</sex>
</user>
<user id="1000002">
<username>Admin2</username>
<email>admin2@live.cn</email>
<age>22</age>
<sex>男</sex>
</user>
<user id="1000003">
<username>Admin3</username>
<email>admin3@live.cn</email>
<age>27</age>
<sex>男</sex>
</user>
<user id="1000004">
<username>Admin4</username>
<email>admin4@live.cn</email>
<age>25</age>
<sex>女</sex>
</user>
<user id="1000005">
<username>Admin5</username>
<email>admin5@live.cn</email>
<age>20</age>
<sex>男</sex>
</user>
<user id="1000006">
<username>Admin6</username>
<email>admin6@live.cn</email>
<age>23</age>
<sex>女</sex>
</user>
B、測試解析XML
demo.py 文件中修改成
if __name__ == "__main__":
test_laod_xml()
執行打印出結果:
-----------------------------------------------------
編 號:1000001
用戶名:Admin
性 別:男
年 齡:23
郵 箱:admin@live.cn
=====================================================
-----------------------------------------------------
編 號:1000002
用戶名:Admin2
性 別:男
年 齡:22
郵 箱:admin2@live.cn
=====================================================
-----------------------------------------------------
編 號:1000003
用戶名:Admin3
性 別:男
年 齡:27
郵 箱:admin3@live.cn
=====================================================
-----------------------------------------------------
編 號:1000004
用戶名:Admin4
性 別:女
年 齡:25
郵 箱:admin4@live.cn
=====================================================
-----------------------------------------------------
編 號:1000005
用戶名:Admin5
性 別:男
年 齡:20
郵 箱:admin5@live.cn
=====================================================
-----------------------------------------------------
編 號:1000006
用戶名:Admin6
性 別:女
年 齡:23
郵 箱:admin6@live.cn
=====================================================