簡單說,F(xiàn)ireFly就是一個(gè)識別服務(wù),可以通過手機(jī)的攝像頭和麥克風(fēng)等識別物體、二維碼、圖像、聲音、視頻等信息。可能很多用戶都用過一些音樂應(yīng)用的“聽歌識曲”功能,亞馬遜的FireFly其實(shí)就是這一功能的增強(qiáng)版,不僅可以識別歌曲,還可以識別各種物體。
FireFly背后的技術(shù)就是音頻、圖像的識別和分析匹配。但是相比歌曲的識別,物體的識別難度更高。因?yàn)楦枨囊纛l比較容易分析,而且歌曲數(shù)量有限,便于匹配,而物體的數(shù)量遠(yuǎn)遠(yuǎn)大于音樂,因此更難批評。
可以看到,目前FireFly的宣傳視頻以識別音樂和書籍為主,那是因?yàn)檫@些產(chǎn)品標(biāo)準(zhǔn)化程度較高,容易識別。
比如書籍的封面,只需要識別封面圖像然后和圖書庫的圖書封面匹配就行。但如果要識別一臺數(shù)碼相機(jī),不同角度拍攝會(huì)不一樣,而且不同品牌、型號的相機(jī)差別可能并不大,要能分辨出來這就需要很強(qiáng)的識別和分析能力。
從另一個(gè)角度來說,越難做的事情往往價(jià)值越大。
識別歌曲的作用僅限于音樂垂直領(lǐng)域,但是識別物體則可以應(yīng)用在更多場景。比如識別數(shù)碼相機(jī)后了解相機(jī)的價(jià)格甚至進(jìn)一步購買該相機(jī)——這也是亞馬遜做FireFly的長處,因?yàn)閬嗰R遜的電商平臺能為識別出來的產(chǎn)品提供購買渠道。
用戶之所以需要去識別一個(gè)物體,很有可能就是希望購買這樣的產(chǎn)品,所以將識別和電商對接對用戶來說很有幫助。而且這樣一來,線下物體就成了亞馬遜電商平臺產(chǎn)品的展示。
值得一提的是,F(xiàn)ireFly用到的識別技術(shù),無論是識別音頻還是識別物體,都不是最近才出現(xiàn)的,但是過去更多可能是垂直應(yīng)用(比如獨(dú)立的一個(gè)物體識別應(yīng)用或者音頻識別應(yīng)用),但亞馬遜將這些功能結(jié)合到了一起,并對接了電商平臺,解決了過去“識別之后還能干什么”的問題。
亞馬遜FireFly要成功的話需要做好兩件事:一是提高物體識別的能力,包括能夠識別同一物體的不同照片,以及識別更多物體;二是在識別出物體后給用戶提供更多信息,比如物品的介紹以及購買鏈接。
當(dāng)然,亞馬遜FireFly現(xiàn)在也無法識別所有物體。據(jù)亞馬遜創(chuàng)始人、CEO貝索斯在發(fā)布會(huì)上介紹,目前FireFly能識別出約1億種物體,這已經(jīng)是一個(gè)比較大的數(shù)字了。而未來隨著用戶的增加,這項(xiàng)功能也會(huì)得到不斷的改進(jìn)。
新聞熱點(diǎn)
疑難解答
圖片精選