国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

在Python中利用Into包整潔地進行數據遷移的教程

2020-02-23 00:26:42
字體:
來源:轉載
供稿:網友

動機

我們花費大量的時間將數據從普通的交換格式(比如CSV),遷移到像數組、數據庫或者二進制存儲等高效的計算格式。更糟糕的是,許多人沒有將數據遷移到高效的格式,因為他們不知道怎么(或者不能)為他們的工具管理特定的遷移方法。

你所選擇的數據格式很重要,它會強烈地影響程序性能(經驗規律表明會有10倍的差距),以及那些輕易使用和理解你數據的人。

當提倡Blaze項目時,我經常說:“Blaze能幫助你查詢各種格式的數據。”這實際上是假設你能夠將數據轉換成指定的格式。

進入into項目

into函數能在各種數據格式之間高效的遷移數據。這里的數據格式既包括內存中的數據結構,比如:

列表、集合、元組、迭代器、numpy中的ndarray、pandas中的DataFrame、dynd中的array,以及上述各類的流式序列。

也包括存在于Python程序之外的持久化數據,比如:

CSV、JSON、行定界的JSON,以及以上各類的遠程版本

HDF5 (標準格式與Pandas格式皆可)、 BColz、 SAS、 SQL 數據庫 ( SQLAlchemy支持的皆可)、 Mongo

into項目能在上述數據格式的任意兩個格式之間高效的遷移數據,其原理是利用一個成對轉換的網絡(該文章底部有直觀的解釋)。

如何使用它

into函數有兩個參數:source和target。它將數據從source轉換成target。source和target能夠使用如下的格式:

Target     Source     Example

Object    Object      A particular DataFrame or list

String     String      ‘file.csv', ‘postgresql://hostname::tablename'

Type                   Like list or pd.DataFrame

所以,下邊是對into函數的合法調用:
 

>>> into(list, df) # create new list from Pandas DataFrame >>> into([], df) # append onto existing list >>> into('myfile.json', df) # Dump dataframe to line-delimited JSON >>> into(Iterator, 'myfiles.*.csv') # Stream through many CSV files >>> into('postgresql://hostname::tablename', df) # Migrate dataframe to Postgres >>> into('postgresql://hostname::tablename', 'myfile.*.csv') # Load CSVs to Postgres >>> into('myfile.json', 'postgresql://hostname::tablename') # Dump Postgres to JSON >>> into(pd.DataFrame, 'mongodb://hostname/db::collection') # Dump Mongo to DataFrame

Note that into is a single function. We're used to doing this with various to_csv, from_sql methods on various types. The into api is very small; Here is what you need in order to get started:

注意,into函數是一個單一的函數。雖然我們習慣于在各種類型上使用to_csv, from_sql等方法來完成這樣的功能,但接口into非常簡單。開始使用into函數前,你需要:

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 南汇区| 西平县| 德州市| 大方县| 循化| 吴江市| 繁峙县| 逊克县| 滕州市| 华安县| 辽宁省| 如东县| 娱乐| 仪陇县| 张家港市| 蓬溪县| 古田县| 元江| 南部县| 辽宁省| 麻江县| 巫溪县| 西乌| 新密市| 贺兰县| 公主岭市| 宁波市| 南宫市| 曲周县| 渭源县| 习水县| 宁南县| 昌图县| 蓬安县| 星座| 车致| 和静县| 克拉玛依市| 聂拉木县| 沧州市| 科技|