国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

11個(gè)并不被常用但對(duì)開發(fā)非常有幫助的Python庫

2019-11-25 17:53:02
字體:
供稿:網(wǎng)友

近來,越來越多的數(shù)據(jù)科學(xué)家開始使用Python,我不由得想到,盡管他們從pandasscikit-learnnumpy這些庫中得到了不少好處,但是他們也許錯(cuò)過了一些也許較老但同樣有幫助的Python庫。

在這篇博文里,我將給大家推薦一些鮮為人知的庫。即便你是Python高手,也應(yīng)該看一看,其中的一到兩個(gè)庫可能是你從沒見過的。
1)Delores

Dolorean是一個(gè)很酷的日期/時(shí)間庫。除了名字好聽之外,也是一個(gè)我曾用過的最舒心的日期/時(shí)間修改庫。它有點(diǎn)像javascript的moment庫,每次我導(dǎo)入它的時(shí)候都會(huì)想笑。文檔也很棒,除了有技術(shù)指導(dǎo)外,他們還引用了《回到未來》的無數(shù)內(nèi)容(來豐富文檔)。
 

from delorean import DeloreanEST = "US/Eastern"d = Delorean(timezone=EST)

2015331142934459.jpg (300×168)

2)prettytable

這個(gè)包被放到了GoogleCode上,所以你可能沒聽說過。GoogleCode現(xiàn)在就像西伯利亞一樣荒涼。

盡管它被流放到了一個(gè)冰天雪地、荒無人煙的地方,prettytable仍舊是最棒的結(jié)構(gòu)化輸出的庫,它能在終端或?yàn)g覽器里構(gòu)建良好的輸出。因此,如果你正在用 IPython Notebook的新插件,建議你用prettytable來代替__repr__進(jìn)行HTML輸出。
 

from prettytable import PrettyTabletable = PrettyTable(["animal", "ferocity"])table.add_row(["wolverine", 100])table.add_row(["grizzly", 87])table.add_row(["Rabbit of Caerbannog", 110])table.add_row(["cat", -1])table.add_row(["platypus", 23])table.add_row(["dolphin", 63])table.add_row(["albatross", 44])table.sort_key("ferocity")table.reversesort = True+----------------------+----------+|  animal  | ferocity |+----------------------+----------+| Rabbit of Caerbannog | 110 ||  wolverine  | 100 ||  grizzly  | 87 ||  dolphin  | 63 ||  albatross  | 44 ||  platypus  | 23 ||   cat   | -1 |+----------------------+----------+

3)snowballstemmer

我當(dāng)初裝snowballstemmer,是因?yàn)槲矣X得這個(gè)名字很酷炫。但它的確是一個(gè)小巧好使的包。snowballstemmer通過porter stemmer算法來提取15種語言的單詞詞干。
 
from snowballstemmer import EnglishStemmer, SpanishStemmer
EnglishStemmer().stemWord("Gregory")
# Gregori
SpanishStemmer().stemWord("amarillo")
# amarill
4)wget

還記得你每次都為特定的目標(biāo)寫web爬蟲么?以后我們可以用其他辦法來完成了,那就是wget.想要以遞歸的方式下載所有頁面?想要抓取頁面上的每張圖?想要避免cookie追蹤?wget可以給你想要的一切。

馬克?扎格伯格的電影里它自己都說

    從柯克蘭(寢室名)開始,這里的一切公共目錄都是公開的,還允許在Apache系統(tǒng)里插入目錄。所以用個(gè)wget就能下載柯克蘭全部的照片庫里的圖片了。易如反掌!

2015331143026217.jpg (253×199)

    這個(gè)頁面有你想問的關(guān)于這個(gè)庫的一切問題,而且它很易用。
 

import wgetwget.download("<a )# 100% [............................................................................] 280385 / 280385

linux和osx的用戶還會(huì)用到另一個(gè)選項(xiàng):from sh import wget。不過Python wget模塊還有更好的參數(shù)處理。
5)PyMC

我不記得是怎么得到PyMC包的了。scikit-learn似乎是所有人的寵兒(它應(yīng)得的,它太出色了),但是依我看來,PyMC更有魅力。
 

from pymc.examples import disaster_modelfrom pymc import MCMCM = MCMC(disaster_model)M.sample(iter=10000, burn=1000, thin=10)[-----------------100%-----------------] 10000 of 10000 complete in 1.4 sec

你還不清楚它是干嘛的?那我告訴你,PyMC主要用來做貝葉斯定理分析。它的特點(diǎn)在Cam Davidson-Pilon的Bayesian Methods for Hackers里著重介紹過,它在許多流行的數(shù)據(jù)科學(xué)/python博客上也是一顆閃耀的鉆石,但是它從來沒得到過像它的同類scikit-learn一樣的狂熱追捧。
6)sh

我不能在你還不知道sh庫的情況下,就讓你離開。sh用來將shell命令導(dǎo)入到Python中。在bash它超有用,但在Python里你可能就不住怎么使用(即遞歸搜索文件)。
 

from sh import findfind("/tmp")/tmp/foo/tmp/foo/file1.json/tmp/foo/file2.json/tmp/foo/file3.json/tmp/foo/bar/file3.json

7)fuzzywuzzy

這是我用過的能排在前十里的最簡單的庫。(如果你有2、3分鐘,你可以讀一下這個(gè)資源),fuzzywuzzy 是一個(gè)字符串模糊匹配的庫,它由SeatGeek上的開發(fā)者建立。

fuzzywuzzy實(shí)現(xiàn)了字符串的相似率,令牌比和許多其他的匹配模式。它也可以用來創(chuàng)建特征向量或者匹配不同數(shù)據(jù)庫的記錄。
 

from fuzzywuzzy import fuzzfuzz.ratio("Hit me with your best shot", "Hit me with your pet shark")# 85

8)

如你所想,progressbar在針對(duì)精確數(shù)據(jù)的時(shí)候效果很好,它提供了一個(gè)文本模式的progressbar。但即便是一個(gè)變動(dòng)的不精確數(shù)據(jù),使用它也比用那些很長的腳本好。

唉,這又是一個(gè)GoogleCode的犧牲品,它沒有受到太多關(guān)注(文檔有兩個(gè)空格的縮進(jìn))。用pip install可以安裝它。
 

9)colorama

在你用progressbar打印日志時(shí),為什么不給它們加上顏色呢!實(shí)際上,當(dāng)出現(xiàn)重大錯(cuò)誤時(shí),它能很快的給你提醒。

colorama很容易使用。只要把它寫進(jìn)你的腳本,添加到想要打印的文本之前:

colorama-red
10)uuid

對(duì)于我來說,編程中真正需要的工具只有那么幾個(gè):哈希,鍵值對(duì)存儲(chǔ),和通用唯一標(biāo)識(shí)符。uuid就是Python的一個(gè)UUID包。它實(shí)現(xiàn)了UUID standards標(biāo)準(zhǔn)的1,3,4,5版本。在確保唯一性上真的很方便。

這聽起來可能會(huì)有點(diǎn)傻,但你有多少次想要給市場營銷的(銷售貨物)加上唯一的促銷代碼?或著給e-mail收件人加上唯一的id號(hào)?

如果你擔(dān)心耗盡ids,完全不用!UUID的可以生成原子數(shù)據(jù)。
 

import uuidprint uuid.uuid4()# e7bafa3d-274e-4b0a-b9cc-d898957b4b61

2015331143107358.jpg (298×300)

如果你是UUID,你可能會(huì)這么想~~~~~
11)bashplotlib

不要臉的毛遂自薦一下,bashplotlib是我創(chuàng)建的一個(gè)庫。它通過標(biāo)準(zhǔn)輸入繪制出柱狀圖和散點(diǎn)圖。當(dāng)然,你不需要考慮用它來替代ggplot或matplotlib來作為你每天繪圖的包,只要作為新奇玩意試試就好。但至少,你可以使用它把你的日志文件弄的好看點(diǎn)。
 

$ pip install bashplotlib$ scatter --file data/texas.txt --pch x

2015331143204120.jpg (284×300)

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 红河县| 八宿县| 岳池县| 朝阳县| 揭西县| 延吉市| 永吉县| 南安市| 尉氏县| 溧阳市| 弋阳县| 莫力| 田阳县| 龙岩市| 嘉义县| 鄂伦春自治旗| 栾川县| 九寨沟县| 西华县| 万宁市| 沙河市| 江北区| 柳河县| 民勤县| 吉木乃县| 江油市| 施甸县| 郓城县| 青岛市| 泰来县| 辽源市| 宣威市| 竹山县| 厦门市| 科技| 吉水县| 湘潭县| 清涧县| 乌拉特中旗| 修文县| 南汇区|