Python+OpenCV實(shí)現(xiàn)車牌字符分割和識別

2020-01-04 15:28:39

字體：大中小

來源：轉(zhuǎn)載

供稿：網(wǎng)友

最近做一個車牌識別項(xiàng)目，入門級別的，十分簡單。

車牌識別總體分成兩個大的步驟：

一、車牌定位：從照片中圈出車牌

二、車牌字符識別

這里只說第二個步驟，字符識別包括兩個步驟：

1、圖像處理

原本的圖像每個像素點(diǎn)都是RGB定義的，或者稱為有R/G/B三個通道。在這種情況下，很難區(qū)分誰是背景，誰是字符，所以需要對圖像進(jìn)行一些處理，把每個RGB定義的像素點(diǎn)都轉(zhuǎn)化成一個bit位（即0-1代碼），具體方法如下：

①將圖片灰度化

名字拗口，但是意思很好理解，就是把每個像素的RGB都變成灰色的RGB值，而灰色的RGB值是R=G=B的。具體怎么改變暫且忽略，因?yàn)镺penCV有封裝好的函數(shù)。

②將灰度圖片二值化

我們做第一步的目的就是為了讓每個像素都可以轉(zhuǎn)變成0或1。再解釋一下，既然每個像素的RGB值都相等了，那么將這個值稱為灰度值，假設(shè)一張灰度車牌圖片中，背景的灰度值集中在180（十進(jìn)制）左右，而字符的灰度值集中在20左右，那么我們規(guī)定一個中間值100，小于100的像素點(diǎn)就可以全部變成0，大于100的像素點(diǎn)可以全部變成1，這樣就實(shí)現(xiàn)了二值化。

③旋轉(zhuǎn)調(diào)平

這個就不說了。

④去燥

這個涉及另外一些方法，以后有時間再補(bǔ)充，入門項(xiàng)目不作要求。

2、圖像切割和識別

①圖像切割

切割可以很簡單，也可以很難，關(guān)鍵是方法的選擇。

在這就用最弱智的方法進(jìn)行切割吧。

圖片現(xiàn)在已經(jīng)成為一個0-1矩陣了，其中要么0是背景而1是字符，或者1是背景而0是字符，那就簡單粗暴地用每一列的0-1數(shù)來切割。

我先在這里假設(shè)圖片幾乎水平，而且?guī)缀鯖]有噪點(diǎn)，具體方法如下：

a.將每一列的1值和0值分別統(tǒng)計(jì)起來。

b.根據(jù)每一列的0-1總和變換來切割字符

②圖像識別

將每一個字符的圖片分割出來后，就可以根據(jù)模板來判斷是哪個字符了。

簡單的方法有兩種：

a.逐個像素比對，如果一致則count加一，最后根據(jù)count值確定匹配結(jié)果。

b.投影匹配：將每行、每列的像素位統(tǒng)計(jì)起來，根據(jù)差值大小來確定匹配結(jié)果。

兩種方法結(jié)合效果很好。

具體的識別之后再補(bǔ)充。

下面是字符分割的代碼。

import cv2  # 1、讀取圖像，并把圖像轉(zhuǎn)換為灰度圖像并顯示 img = cv2.imread("chepai/6.png") # 讀取圖片 img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  # 轉(zhuǎn)換了灰度化 cv2.imshow('gray', img_gray) # 顯示圖片 cv2.waitKey(0)  # 2、將灰度圖像二值化，設(shè)定閾值是100 img_thre = img_gray cv2.threshold(img_gray, 100, 255, cv2.THRESH_BINARY_INV, img_thre) cv2.imshow('threshold', img_thre) cv2.waitKey(0)  # 3、保存黑白圖片 cv2.imwrite('thre_res.png', img_thre)  # 4、分割字符 white = [] # 記錄每一列的白色像素總和 black = [] # ..........黑色....... height = img_thre.shape[0] width = img_thre.shape[1] white_max = 0 black_max = 0 # 計(jì)算每一列的黑白色像素總和 for i in range(width):   s = 0 # 這一列白色總數(shù)   t = 0 # 這一列黑色總數(shù)   for j in range(height):     if img_thre[j][i] == 255:       s += 1     if img_thre[j][i] == 0:       t += 1   white_max = max(white_max, s)   black_max = max(black_max, t)   white.append(s)   black.append(t)   print(s)   print(t)  arg = False # False表示白底黑字；True表示黑底白字 if black_max > white_max:   arg = True  # 分割圖像 def find_end(start_):   end_ = start_+1   for m in range(start_+1, width-1):     if (black[m] if arg else white[m]) > (0.95 * black_max if arg else 0.95 * white_max): # 0.95這個參數(shù)請多調(diào)整，對應(yīng)下面的0.05       end_ = m       break   return end_  n = 1 start = 1 end = 2 while n < width-2:   n += 1   if (white[n] if arg else black[n]) > (0.05 * white_max if arg else 0.05 * black_max):     # 上面這些判斷用來辨別是白底黑字還是黑底白字     # 0.05這個參數(shù)請多調(diào)整，對應(yīng)上面的0.95     start = n     end = find_end(start)     n = end     if end-start > 5:       cj = img_thre[1:height, start:end]       cv2.imshow('caijian', cj)       cv2.waitKey(0)

源程序中沒有將圖片輸出，而只是顯示出來，下面是執(zhí)行結(jié)果

原圖片：

python,車牌字符分割,車牌識別,OpenCV