對(duì)于那些需要在登錄環(huán)境下進(jìn)行的爬蟲(chóng)操作,模擬登陸或偽裝已登錄狀態(tài)是一個(gè)剛需。
分析了網(wǎng)上關(guān)于模擬登錄的例子,很多都基于用戶名/密碼發(fā)起一個(gè)post請(qǐng)求,遇到有圖片驗(yàn)證碼的,比較理想的方法是進(jìn)行人工干預(yù),同步發(fā)起一個(gè)圖片驗(yàn)證碼的請(qǐng)求,將圖片寫(xiě)到本地,人工查看后進(jìn)行輸入。
既然,少不了人工干預(yù),為何登錄操作不全程人工進(jìn)行,已登錄后再把瀏覽器的Cookie信息全拷貝出來(lái),通過(guò)爬蟲(chóng)偽造成一個(gè)已登錄的瀏覽器呢? 我暫時(shí)試了試國(guó)內(nèi)的幾個(gè)大網(wǎng)站,發(fā)現(xiàn)都行得通,可以模擬瀏覽器進(jìn)行登錄之后的很多操作,包括簽到,修改個(gè)人資料等。
下面貼上簡(jiǎn)單的代碼實(shí)現(xiàn):

后話:關(guān)于圖片驗(yàn)證碼,為什么沒(méi)有必要去搞一個(gè)自動(dòng)識(shí)別?
因?yàn)橄裣旅孢@種簡(jiǎn)單的,你也許花上幾天就可以搞定:

但是很多網(wǎng)站它的驗(yàn)證碼會(huì)不斷地變換策略,它變一次可能很快,但對(duì)你來(lái)說(shuō)可能就得花上好幾天去改代碼,也許你還沒(méi)改完,人家又變了,總之,玩不過(guò)你也可以玩死你。
當(dāng)它想換下面的姿勢(shì)給你點(diǎn)驚喜,如果你還沒(méi)破解出它的上一套驗(yàn)證碼時(shí),你肯定會(huì)后悔大學(xué)選錯(cuò)了專(zhuān)業(yè):

為了開(kāi)發(fā)出自動(dòng)搶票軟件,360用了高精尖的團(tuán)隊(duì),也好像不能百分百識(shí)別出下面反人類(lèi)的驗(yàn)證碼:

以上所述是小編給大家介紹的python通過(guò)cookie模擬已登錄狀態(tài)的初步研究,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)武林網(wǎng)網(wǎng)站的支持!
新聞熱點(diǎn)
疑難解答
圖片精選