国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 系統 > Android > 正文

Android實現掃一掃識別數字功能

2019-12-12 02:02:25
字體:
來源:轉載
供稿:網友

1.準備工作

  • 首先實現識別數字等字符,我們要知道需要采用OCR (Optical Character Recognition,光學字符識別)來實現。而tesseract是非常不錯的開源OCR工具,但是要在Android中直接使用可能要費點功夫。不過不用擔心,tess-two拯救了我們。
  • 其次是掃一掃識別,那么很快聯想到的就是常見的二維碼掃描這類的項目。通過掃一掃實時拿到圖像,來做識別。
  • 接下來在Github上找到了QrCodeScanner項目,作者通過一定的優化,使得識別的效率有所提升。那么我們用它來掃描數字,也會有效率上的提升。

2.實現細節

1.首先是tess-two的用法。

app下的build.gradle的配置如下

android {  defaultConfig {    ....    ndk {      abiFilters 'armeabi' //自行選擇添加    }  }}dependencies {  compile 'com.rmtheis:tess-two:8.0.0'}

識別方法:

public String detectText(Bitmap bitmap) {    TessBaseAPI tessBaseAPI = new TessBaseAPI();    String path = ""; //訓練數據路徑    tessBaseAPI.setDebug(true);    tessBaseAPI.init(path, "eng"); //eng為識別語言    tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789"); // 識別白名單    tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_BLACKLIST, "!@#$%^&*()_+=-[]}{;:'/"http://|~`,./<>?"); // 識別黑名單    tessBaseAPI.setPageSegMode(TessBaseAPI.PageSegMode.PSM_AUTO_OSD);//設置識別模式    tessBaseAPI.setImage(bitmap); //設置需要識別圖片的bitmap    String inspection = tessBaseAPI.getHOCRText(0);    tessBaseAPI.end();    return inspection ;  }

訓練數據可以在tessdata下載,里面包含各種語言。當然你自己也可以訓練它,有興趣的可以學習一下相關內容。

2.從tess-two的用法可以知道,我們最終需要的是識別圖片的Bitmap。在掃碼項目中我們找到在DecodeHandler類的decode方法中,我們會得到一個PlanarYUVLuminanceSource類的實例。在使用HybridBinarizer算法解析數據源,最終采用MultiFormatReader解析圖像出結果。代碼大致如下:

 Result rawResult = null;  MultiFormatReader mMultiFormatReade = new MultiFormatReader();  try {    PlanarYUVLuminanceSource source =          new PlanarYUVLuminanceSource(```, false);    BinaryBitmap bitmap = new BinaryBitmap(new HybridBinarizer(source));    rawResult = mMultiFormatReader.decode(bitmap, mHints);  } catch (ReaderException ignored) {  } finally {    mMultiFormatReader.reset();  }

看完后懵逼了,沒有Bitmap。經過一番查找,找到了在舊版的zxing中PlanarYUVLuminanceSource類有renderCroppedGreyscaleBitmap方法,不知為何去除了。。。

3.之后修改了一些相機的參數信息,適配了部分設備的預覽效果。基本的頁面修改了一下。這里就不贅述了。

走一波,如下效果:

可以發現除了數字以外,它將中文識別為了字母。其實問題首先是我們使用了英文的訓練數據,同時白名單設置了a~z的字母。當然你也不能將字母設置為黑名單,那樣只會讓識別不出的字符識別為亂七八糟的數字。

這里我給出的建議是利用正則去篩選,這樣你可以識別你想要的各種格式數據。我這里只是做了手機號的簡單識別,大家可以舉一反三去處理。

 public static String getTelNum(String sParam){    if(TextUtils.isEmpty(sParam)){      return "";    }    Pattern pattern = Pattern.compile("(1|861)(3|5|7|8)//d{9}$*");    Matcher matcher = pattern.matcher(sParam);    StringBuilder bf = new StringBuilder();    while (matcher.find()) {      bf.append(matcher.group()).append(",");    }    int len = bf.length();    if (len > 0) {      bf.deleteCharAt(len - 1);    }    return bf.toString();  }

修改后如下:(同時支持多個號碼)

 

當然本項目也保留了掃碼功能(可在DecodeHandler中自己添加條碼格式):

 

細心的同學可以從圖中看到掃描框的大小都不一樣,這里我是改成了可以手動調節大小的掃描框。畢竟掃碼模式下,框大一點還是比較好識別(將二維碼放入框中有時就費時間)。掃數字這些文字時,框小一點會好識別。具體可以下載自行體驗。

最后我將代碼已經上傳至Github:Tesseract-OCR-Scanner

總結

以上所述是小編給大家介紹的Android實現掃一掃識別數字功能,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對武林網網站的支持!

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 江津市| 平陆县| 北辰区| 开封县| 榆林市| 舞钢市| 都江堰市| 青浦区| 仁寿县| 宁强县| 泾川县| 乌什县| 泸水县| 通山县| 三亚市| 商城县| 阳江市| 松滋市| 东台市| 黄龙县| 和平县| 镇沅| 香格里拉县| 哈密市| 潼南县| 尼勒克县| 泰来县| 通江县| 绥化市| 江孜县| 靖州| 宝应县| 大田县| 罗定市| 芦山县| 大邑县| 龙岩市| 石景山区| 彰化市| 金山区| 库车县|