首頁| 新聞| 娛樂| 游戲| 科普| 文學(xué)| 編程| 系統(tǒng)| 數(shù)據(jù)庫| 建站| 學(xué)院| 產(chǎn)品| 網(wǎng)管| 維修| 辦公| 熱點(diǎn)
最近學(xué)習(xí)Python,于是就用Python寫了一個(gè)抓取Discuz!用戶名的腳本,代碼很少但是很搓。思路很簡單,就是正則匹配title然后提取用戶名寫入文本文檔。程序以百度站長社區(qū)為例(一共有40多萬用戶),掛在VPS上就沒管了,雖然用了延時(shí)但是后來發(fā)現(xiàn)一共只抓取了50000多個(gè)用戶名就被封了。。。代碼如下:
最終成果如下:
索泰發(fā)布一款GTX 1070 Mini迷
AMD新旗艦顯卡輕松干翻NVIDIA
索泰發(fā)布一款GTX 1070 Mini迷你版本:小機(jī)
芭蕾舞蹈表演,真實(shí)美到極致
下午茶時(shí)間,悠然自得的休憩
充斥這繁華奢靡氣息的城市迪拜風(fēng)景圖片
從山間到田野再到大海美麗的自然風(fēng)景圖片
肉食主義者的最愛美食烤肉圖片
夏日甜心草莓美食圖片
人逢知己千杯少,喝酒搞笑圖集
搞笑試卷,學(xué)生惡搞答題
新聞熱點(diǎn)
疑難解答
圖片精選
Python入門教程 超詳細(xì)1小時(shí)學(xué)會(huì)Py
Python linecache.getline()讀取文
Python 命令行參數(shù)sys.argv
Python httplib,smtplib使用方法
網(wǎng)友關(guān)注