国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Ubuntu下使用python讀取doc和docx文檔的內容方法

2020-02-23 00:02:52
字體:
來源:轉載
供稿:網友

讀取docx文檔

使用的包是python-docx

1. 安裝python-docx包

sudo pip install python-docx 

2. 使用python-docx包讀取數據

#encoding:utf8 import docx doc = docx.Document('test.docx') docText = '/n'.join([paragraph.text for paragraph in doc.paragraphs]) #print(docText) 

python-docx這個包是不能處理doc文檔的,要讀取doc文檔內容的話需要使用antiword這個工具。

讀取doc文檔

1. 到網站下載antiword。

2. 下載完畢之后解壓,在解壓得到的文件夾中依次運行make和make install命令。

3. 使用antiword讀取doc文檔內容

#encoding:utf8 import subprocess word = 'test.doc' output = subprocess.check_output(['antiword',word]) print(output) 

以上這篇Ubuntu下使用python讀取doc和docx文檔的內容方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 昆明市| 星座| 晋城| 静安区| 常宁市| 江西省| 松江区| 丹棱县| 襄汾县| 左云县| 吐鲁番市| 南乐县| 平乐县| 中卫市| 视频| 汉寿县| 石城县| 阿拉善左旗| 拉孜县| 钦州市| 玛沁县| 吉安市| 南投县| 唐山市| 得荣县| 东乌珠穆沁旗| 城市| 达孜县| 镇赉县| 金川县| 博乐市| 道真| 金昌市| 潼关县| 墨脱县| 江门市| 汽车| 双城市| 定结县| 高清| 卓资县|