Android實現掃一掃識別數字功能

2019-12-12 02:02:25

字體：大中小

來源：轉載

供稿：網友

1.準備工作

首先實現識別數字等字符，我們要知道需要采用OCR （Optical Character Recognition，光學字符識別）來實現。而tesseract是非常不錯的開源OCR工具，但是要在Android中直接使用可能要費點功夫。不過不用擔心，tess-two拯救了我們。
其次是掃一掃識別，那么很快聯想到的就是常見的二維碼掃描這類的項目。通過掃一掃實時拿到圖像，來做識別。
接下來在Github上找到了QrCodeScanner項目，作者通過一定的優化，使得識別的效率有所提升。那么我們用它來掃描數字，也會有效率上的提升。

2.實現細節

1.首先是tess-two的用法。

app下的build.gradle的配置如下

android {  defaultConfig {    ....    ndk {      abiFilters 'armeabi' //自行選擇添加    }  }}dependencies {  compile 'com.rmtheis:tess-two:8.0.0'}

識別方法：

public String detectText(Bitmap bitmap) {    TessBaseAPI tessBaseAPI = new TessBaseAPI();    String path = ""; //訓練數據路徑    tessBaseAPI.setDebug(true);    tessBaseAPI.init(path, "eng"); //eng為識別語言    tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789"); // 識別白名單    tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_BLACKLIST, "!@#$%^&*()_+=-[]}{;:'/"http://|~`,./<>?"); // 識別黑名單    tessBaseAPI.setPageSegMode(TessBaseAPI.PageSegMode.PSM_AUTO_OSD);//設置識別模式    tessBaseAPI.setImage(bitmap); //設置需要識別圖片的bitmap    String inspection = tessBaseAPI.getHOCRText(0);    tessBaseAPI.end();    return inspection ;  }

訓練數據可以在tessdata下載，里面包含各種語言。當然你自己也可以訓練它，有興趣的可以學習一下相關內容。

2.從tess-two的用法可以知道，我們最終需要的是識別圖片的Bitmap。在掃碼項目中我們找到在DecodeHandler類的decode方法中，我們會得到一個PlanarYUVLuminanceSource類的實例。在使用HybridBinarizer算法解析數據源，最終采用MultiFormatReader解析圖像出結果。代碼大致如下：

 Result rawResult = null;  MultiFormatReader mMultiFormatReade = new MultiFormatReader();  try {    PlanarYUVLuminanceSource source =          new PlanarYUVLuminanceSource(```, false);    BinaryBitmap bitmap = new BinaryBitmap(new HybridBinarizer(source));    rawResult = mMultiFormatReader.decode(bitmap, mHints);  } catch (ReaderException ignored) {  } finally {    mMultiFormatReader.reset();  }

看完后懵逼了，沒有Bitmap。經過一番查找，找到了在舊版的zxing中PlanarYUVLuminanceSource類有renderCroppedGreyscaleBitmap方法，不知為何去除了。。。

3.之后修改了一些相機的參數信息，適配了部分設備的預覽效果。基本的頁面修改了一下。這里就不贅述了。

走一波，如下效果：

可以發現除了數字以外，它將中文識別為了字母。其實問題首先是我們使用了英文的訓練數據，同時白名單設置了a~z的字母。當然你也不能將字母設置為黑名單，那樣只會讓識別不出的字符識別為亂七八糟的數字。

這里我給出的建議是利用正則去篩選，這樣你可以識別你想要的各種格式數據。我這里只是做了手機號的簡單識別，大家可以舉一反三去處理。

 public static String getTelNum(String sParam){    if(TextUtils.isEmpty(sParam)){      return "";    }    Pattern pattern = Pattern.compile("(1|861)(3|5|7|8)//d{9}$*");    Matcher matcher = pattern.matcher(sParam);    StringBuilder bf = new StringBuilder();    while (matcher.find()) {      bf.append(matcher.group()).append(",");    }    int len = bf.length();    if (len > 0) {      bf.deleteCharAt(len - 1);    }    return bf.toString();  }

修改后如下：（同時支持多個號碼）