国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Ubuntu下使用python讀取doc和docx文檔的內容方法

2020-01-04 15:09:21
字體:
來源:轉載
供稿:網友

讀取docx文檔

使用的包是python-docx

1. 安裝python-docx包

sudo pip install python-docx 

2. 使用python-docx包讀取數據

#encoding:utf8 import docx doc = docx.Document('test.docx') docText = '/n'.join([paragraph.text for paragraph in doc.paragraphs]) #print(docText) 

python-docx這個包是不能處理doc文檔的,要讀取doc文檔內容的話需要使用antiword這個工具。

讀取doc文檔

1. 到網站下載antiword。

2. 下載完畢之后解壓,在解壓得到的文件夾中依次運行make和make install命令。

3. 使用antiword讀取doc文檔內容

#encoding:utf8 import subprocess word = 'test.doc' output = subprocess.check_output(['antiword',word]) print(output) 

以上這篇Ubuntu下使用python讀取doc和docx文檔的內容方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持VEVB武林網。


注:相關教程知識閱讀請移步到python教程頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 灵宝市| 松阳县| 根河市| 昌图县| 黑河市| 玛沁县| 阜阳市| 天津市| 老河口市| 西乌珠穆沁旗| 柘荣县| 北流市| 固原市| 礼泉县| 黄陵县| 广丰县| 新竹县| 米林县| 海口市| 石泉县| 滁州市| 锦屏县| 黄骅市| 铁力市| 康定县| 泰州市| 开江县| 苗栗县| 东光县| 陇南市| 宁河县| 调兵山市| 增城市| 沐川县| 九龙坡区| 日喀则市| 太仆寺旗| 贞丰县| 沙坪坝区| 达拉特旗| 泰和县|