国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

用Python讀取幾十萬行文本數(shù)據(jù)

2020-02-16 00:17:54
字體:
供稿:網(wǎng)友

我在使用python讀取幾十萬行的文件中的數(shù)據(jù),并構(gòu)造字典,列表等數(shù)據(jù)結(jié)構(gòu)時(shí),再訪問字典,列表時(shí),一般都會出現(xiàn)內(nèi)存不夠的問題,然后只能循環(huán)讀取幾百行或者一定數(shù)量的行數(shù)來循環(huán)操作。

keyword_list=[line.strip() for line in open("keywords.txt",'r')]#f1=open("part_wiki_vec.txt",'r')f1=open("wiki_vectors.txt")f2=open("result.txt",'w')i=0content=f1.readlines()while i<1150: for line in content[300*i:300*(i+1)]:  line=line.strip().split(' ')  if line[0] in keyword_list:   wordvec=' '.join(line)   print wordvec   f2.write(wordvec)  #print line i+=1

我是這樣讀取的

應(yīng)該還有很多好的方法,比如多線程等等。

做此記錄只為了學(xué)習(xí)

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對武林站長站的支持。如果你想了解更多相關(guān)內(nèi)容請查看下面相關(guān)鏈接

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 宁乡县| 通许县| 茶陵县| 渭源县| 清水河县| 廊坊市| 隆安县| 曲阜市| 宁海县| 贺兰县| 虎林市| 漳州市| 海口市| 库伦旗| 大兴区| 吐鲁番市| 建阳市| 修水县| 东至县| 临沧市| 都匀市| 中牟县| 桐城市| 措美县| 长岭县| 武城县| 比如县| 吕梁市| 荔浦县| 肇庆市| 象州县| 雅江县| 东光县| 黔东| 宜宾县| 新安县| 蚌埠市| 安岳县| 图木舒克市| 保康县| 汶川县|