不久之前,亞馬遜剛剛推出了DeepLens 。這是一款專門面向開發人員的全球首個支持深度學習的攝像機,它所使用的機器學習算法不僅可以檢測物體活動和面部表情,而且還可以檢測類似彈吉他等復雜的活動。雖然DeepLens還未正式上市,但智能攝像機的概念已經誕生了。
 
 
今天,我們將自己動手打造出一款基于深度學習的照相機,當小鳥出現在攝像頭畫面中時,它將能檢測到小鳥并自動進行拍照。最終成品所拍攝的畫面如下所示:
 
 
相機不傻,它可以很機智
我們不打算將一個深度學習模塊整合到相機中,相反,我們準備將樹莓派“掛鉤”到攝像頭上,然后通過WiFi來發送照片。本著“一切從簡”(窮)為核心出發,我們今天只打算搞一個跟DeepLens類似的概念原型,感興趣的同學可以自己動手嘗試一下。
接下來,我們將使用Python編寫一個Web服務器,樹莓派將使用這個Web服務器來向計算機發送照片,或進行行為推斷和圖像檢測。
 
 
我們這里所使用的計算機其處理能力會更強,它會使用一種名叫 YOLO 的神經網絡架構來檢測輸入的圖像畫面,并判斷小鳥是否出現在了攝像頭畫面內。
我們得先從YOLO架構開始,因為它是目前速度最快的檢測模型之一。該模型專門給Tensorflow(谷歌基于DistBelief進行研發的第二代人工智能學習系統)留了一個接口,所以我們可以輕松地在不同的平臺上安裝和運行這個模型。友情提示,如果你使用的是我們本文所使用的迷你模型,你還可以用CPU來進行檢測,而不只是依賴于價格昂貴的GPU。
接下來回到我們的概念原型上… 如果像框內檢測到了小鳥,那我們就保存圖片并進行下一步分析。
檢測與拍照
 
 
正如我們所說的,DeepLens的拍照功能是整合在計算機里的,所以它可以直接使用板載計算能力來進行基準檢測,并確定圖像是否符合我們的標準。
但是像樹莓派這樣的東西,我們其實并不需要使用它的計算能力來進行實時計算。因此,我們準備使用另一臺計算機來推斷出現在圖像中的內容。
我使用的是一臺簡單的Linux計算機,它帶有一個攝像頭以及WiFi無線網卡( 樹莓派3 + 攝像頭 ),而這個簡單的設備將作為我的深度學習機器并進行圖像推斷。對我來說,這是目前最理想的解決方案了,這不僅大大縮減了我的成本,而且還可以讓我在臺式機上完成所有的計算。
新聞熱點
疑難解答