国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python3一行代碼實現圖片文字識別的示例

2020-02-16 11:37:22
字體:
來源:轉載
供稿:網友

自學Python3第5天,今天突發奇想,想用Python識別圖片里的文字。沒想到Python實現圖片文字識別這么簡單,只需要一行代碼就能搞定

from PIL import Imageimport pytesseract#上面都是導包,只需要下面這一行就能實現圖片文字識別text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')print(text)

我們以識別詩詞為例

下面是我們要識別的圖片

denggao.JPEG

先看下效果圖

圖片文字識別.gif 

我們運行代碼后識別的結果,有幾個字沒有正確識別,但是大多數字都能識別出來。

風急天高猿嘯哀 渚蕓胄芳少白鳥飛鳳無邊落木蕭蕭下, 不盡長量工盲袞宕袞來萬里悲秋常1乍窨, 百年多病獨登氤艱難苦恨擎霜量 漂倒新停澍酉帆

一行代碼就能識別圖片,我們背后要做些準備工作的

    這里我們需要用到兩個庫:pytesseract和PIL 同時我們還需要安裝識別引擎tesseract-ocr

下面就來講講這幾個庫的安裝,因為只有這幾個庫安裝好以后Python才能實現一行代碼實現圖片文字識別

一,pytesseract和PIL的安裝

安裝這兩個包可以借助pip

- 1,命令行安裝

pip install PIL pip install pytesseract 

- 2,如果你用的pycharm編輯器,就可以直接借助pycharm實現快速安裝。

在pycharm的Settings設置頁按照下面步驟操作

pycharm用pip安裝庫.png 

這樣就能成功安裝pytesseract,安裝PIL只需要在上面第三步里搜索PIL并點擊安裝即可

安裝成功.png

這時我們安轉好了庫,運行下面代碼

from PIL import Imageimport pytesseracttext=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')print(text)

會報下面錯誤,錯誤原因是:沒有安裝識別引擎tesseract-ocr

2.png

二,安裝識別引擎tesseract-ocr

1.下載下面的安裝包,然后直接點擊安裝即可
tesseract-ocr安裝包和中文語言包

解壓安裝tesseract-ocr后做如下操作,就可以支持中文識別了。因為tesseract-ocr默認不支持中文識別。

支持中文識別.png

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 鹤山市| 芦溪县| 乌拉特后旗| 昭平县| 社会| 措美县| 隆尧县| 松桃| 白朗县| 汪清县| 聊城市| 阿坝县| 册亨县| 双峰县| 桃源县| 宁海县| 河北区| 佛坪县| 阳西县| 凤冈县| 濮阳市| 车致| 西充县| 唐海县| 潜江市| 刚察县| 惠安县| 新安县| 贵州省| 安福县| 上高县| 桃园市| 新竹市| 澎湖县| 昭通市| 沽源县| 新和县| 新闻| 延长县| 静海县| 西乌珠穆沁旗|