国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 學(xué)院 > 開發(fā)設(shè)計(jì) > 正文

網(wǎng)絡(luò)爬蟲：Requests+lxml

2019-11-14 11:58:09

字體：大中小

來(lái)源：轉(zhuǎn)載

供稿：網(wǎng)友

比較常用

# -*-coding:utf8-*-import requestsfrom lxml import etreeurl="http://econpy.pythonanywhere.com/ex/001.html"page=requests.get(url)html=page.textselector = etree.HTML(html)buyer=selector.xpath('//div[@title="buyer-name"]/text()')這個(gè)用的少一些

# -*-coding:utf8-*-import requestsfrom lxml import htmlurl="http://econpy.pythonanywhere.com/ex/001.html"page=requests.get(url)tree=html.fromstring(page.text)buyer=tree.xpath('//div[@title="buyer-name"]/text()')prices=tree.xpath('//span[@class="item-price"]/text()')print (buyer)print (prices)Xpath的語(yǔ)法參考 http://m.survivalescaperooms.com.cn/xpath/xpath_syntax.asp Chrome中使用時(shí)可以下載插件：Xpath helper參考使用requests和lxml編寫python爬蟲小記 http://www.tuicool.com/articles/vABNRbR

XPath在python中的高級(jí)應(yīng)用參見：http://blog.csdn.net/winterto1990/article/details/47903653

但是遇到中文網(wǎng)頁(yè)時(shí)，中文出現(xiàn)亂碼。

req = requests.get("http://news.sina.com.cn/")print (req.text)

為了解決這個(gè)問(wèn)題，請(qǐng)參考這篇文章： http://blog.csdn.net/chaowanghn/article/details/54889835

上一篇：Leetcode 116. Populating Next Right Pointers in Each Node

下一篇：python中使用print輸出中文

學(xué)習(xí)交流

索泰發(fā)布一款GTX 1070 Mini迷你版本:小機(jī)

索泰發(fā)布一款GTX 1070 Mini迷你版本:小機(jī)箱大愛(ài)...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關(guān)注

新聞熱點(diǎn)

榮耀總裁趙明烏鎮(zhèn)演講：榮耀首款5G手機(jī)V30下月發(fā)布

2019-10-23 09:17:05

搜狐張朝陽(yáng)：回歸媒體是搜狐重新崛起的關(guān)鍵

2019-10-21 09:20:02

華為輪值董事長(zhǎng)郭平：虛擬技術(shù)創(chuàng)造現(xiàn)實(shí)價(jià)值

2019-10-21 09:00:12

滴滴英文服務(wù)上線兩周年用戶已超200萬(wàn)

2019-09-26 08:57:12

華為推出全球至快AI訓(xùn)練集群Atlas900

2019-09-25 08:46:36

馬斯克：特斯拉正組建中國(guó)技術(shù)團(tuán)隊(duì)

2019-09-25 08:15:43

疑難解答

圖片精選

網(wǎng)友關(guān)注

主站蜘蛛池模板：明水县| 罗江县| 武宁县| 夹江县| 昆山市| 邹城市| 丰都县| 泽普县| 和硕县| 五莲县| 安丘市| 离岛区| 铁力市| 得荣县| 兴海县| 安达市| 文昌市| 云龙县| 米脂县| 濉溪县| 镇雄县| 龙州县| 常宁市| 秭归县| 庐江县| 正镶白旗| 南平市| 永登县| 南安市| 乐亭县| 西峡县| 四子王旗| 上林县| 铜鼓县| 闽清县| 叙永县| 湛江市| 武宣县| 肥东县| 宜章县| 新野县|