前言
本來打算寫的標題是XPath語法,但是想了一下Python中的解析庫lxml,使用的是Xpath語法,同樣也是效率比較高的解析方法,所以就寫成了XPath語法和lxml庫的用法
XPath 即為 XML 路徑語言,它是一種用來確定 XML(標準通用標記語言的子集)文檔中某部分位置的語言。
XPath 基于 XML 的樹狀結構,提供在數據結構樹中找尋節點的能力。 XPath 同樣也支持HTML。
XPath 是一門小型的查詢語言。
python 中 lxml庫 使用的是 Xpath 語法,是效率比較高的解析方法。
下面話不多說了,來一起看看詳細的介紹吧
安裝
為什么要用這個庫呢,因為要寫爬蟲啊,利用lxml庫來解析 HTML 代碼,同時lxml也繼承了libxml2的特性自動修正HTML代碼,利用pip安裝即可
pip install lxml
XPath語法
XPath是一門在XML文檔中查找信息的語言,可以用于在XML文檔中通過元素和屬性進行導航
舉個栗子
注:相關教程知識閱讀請移步到python教程頻道。
新聞熱點
疑難解答