您當前的位置:首頁 > 攝影

BAT影象識別產品調研

作者:由 愛讀書的少俠 發表于 攝影時間:2019-02-07

目錄

影象識別概述

檢測與識別的區別

產品調研/競品分析

總結思考

一、影象識別概述

春節假期有空調研競品影象識別產品能力,希望能透過思考分析,預測以後兩三年的影象識別落地應用發展趨勢,看智慧視覺產品能多智慧。這是第一篇,調研業內主流的影象識別平臺提供的服務和能力。

真實世界的影象識別範圍很廣,根據識別物件的不同而劃分細分領域,比如人臉識別,商品識別,文字識別(OCR識別),還有人說色情圖識別,幾乎等同於識別萬物,也因此難度非常大,也就說識別的準確率不高。尤其是商品的識別,SKU動輒上千萬過億,即便是線下門店,超市也有一兩千個SKU,而且通常情況下還不知道是哪個商品組,需要從大的商品池裡確定這個範圍。

而對特定型別目標的識別,即垂直領域的影象識別,識別準確率還是可以的。目前研究較多的有人臉識別——我之前接觸很多,前文備述。還有商品識別,會在本篇影象識別之後,調研對比一下各家產品。

二、影象檢測與識別的區別

先說一下識別和檢測的區別。很少有人加以區分,經常有人把檢測和識別混淆使用,影響溝通。在實際工作中,確實遇到有多年工作經驗的人,不能正確使用檢測和識別,一聽就知道是新入行的。

檢測有兩層含義,最主要是對檢測物件做事實有無的判斷。

例如,人臉檢測,是檢測一張圖片中有無人臉;活體檢測,是檢測是活人還是假體;商品檢測,是檢測有無商品。

檢測的第二層含義是如果檢測結果為是,也即檢測到物件,就要回答在哪,有幾個?

提供檢測服務時,需要檢測出物件後,返回檢測物的位置和數量——一般返回兩個點的座標(例如人臉框對角線上兩個點)。返回的位置和大小,後續才好進行影象採集的工程化。

例如人臉識別的前提,就是人臉的檢測和採集,檢測的時候除了能夠返回人臉的位置和數量,還能同時輸出人臉關鍵點、人臉影象的質量如何,質量通常包括亮度、模糊度、完整度、3D空間姿態角度,以及遮擋程度——這些統稱為人臉質量檢測。

為什麼要做人臉質量檢測?因為它對識別有著重要的意義——輸入高等質量的人臉照片進行識別,能夠相當程度保證識別的準確性。

檢測是輸出有沒有,而識別的含義就是,有的話,是什麼。

例如,你發現前面走來一個美女,走近一看原來是你老婆。這裡就發生了一次檢測(有個美女)和一次識別(是你老婆)。

三、影象識別產品調研/競品分析

本次產品調研分析,除了選取BAT,還選取了另外四家公司:碼隆科技,華為,AI Fastion,YI Tunnel 。這幾家搜尋廣告軟文通稿,吹得很厲害。

經過調研發現,各大人工智慧平臺廠商目前提供的服務如下:

BAT影象識別產品調研

結論1:初步總結,碼隆科技和YI Tunnel影象識別垂直領域,商品識別的積累較多。而BAT未公開宣傳,甚至阿里也沒有,但商品識別的應用,線上部分肯定是有的,線下部分可能剛起步。

結論2:各家主要按識別物件不同將影象能力進行區分,1-4都在做的是場景識別。

結論3:影象處理和稽核與識別,阿里將鑑黃放在影象識別範疇,百度是影象稽核。而稽核結果就是透過、不透過,其實是檢測結果。

BAT影象識別產品調研

BAT影象識別能力一覽

透過能力對比發現,百度在影象識別落地應用的探索上走得更遠。

百度將影象識別按細粒度不同和定製化區分能力,水平領域和垂直領域都有所涉及,作為開放平臺,還推出了定製化影象識別平臺,也就是讓使用者上傳影象資料並進行標註、自動化完成演算法模型訓練的一個平臺,該平臺透過API/SDK提供演算法服務。

BAT影象識別產品調研

車輛檢測與識別,注意看圖中的雷達

值得一提的是,大家都知道百度在做無人車,百度門口就停了幾輛。針對車輛的識別與檢測,除了可以用在城市大腦、智慧城市等城市智慧化管理解決方案中,還可以與自動駕駛結合使用,提升道路行車的安全性。

相比之下,騰訊和阿里提供的服務則相對比較單一。

下面三張圖是BAT具體各個介面的能力介紹,為了提煉出關鍵資訊,我將所有的API介面文件都精讀了一遍。

BAT影象識別產品調研

百度影象識別能力:通用和細粒度影象識別

BAT影象識別產品調研

百度影象識別能力:車輛分析

BAT影象識別產品調研

騰訊的影象識別服務

BAT影象識別產品調研

阿里影象識別服務

下面是影象識別能力的應用場景和解決的問題,資訊整理自BAT平臺官網對外介紹。

BAT影象識別產品調研

影象識別應用場景和案例

看完之後是平淡無奇,不過如此。

不過上述場景總結了當前的影象識別,更多的落地場景在線上。這也很正常,網際網路公司首先解決的是線上業務問題。而其實結合影象做線下的問題解決,還有很大想象空間。百度做車輛識別,依圖做人臉識別,還有領域的落地應用目前還未產生大的價值和廣泛關注。

四、總結思考

影象識別技術如何產生創新和價值?

例如線上下門店場景,影象識別可以做缺貨檢測,可以透過影象採集保質期資訊、做臨期食品監察,等等。雖然都是痛點,但沒有解決特別重大的問題,或者說產生顛覆性、革命性的價值,都是做非常細微的功能點。

大家有點沮喪,覺得殺雞焉用牛刀,人工有點不智慧。於是我們認為自身缺乏一線經驗,和洞察的大智慧。

直到看到羅振宇在跨年演講中的論述:

世界上有很多創新,不是往前、往沒有人的陌生地方走,其實是在往回走。只要你能用新辦法把老事情再做一遍。其實創新一直都存在一個穩定的路徑——若不能進入傳統,則無法新增新事物。

創新就是解決老問題,新增新事物。再來看百度EasyDL定製化影象平臺,收集資料倒是其次,演算法能解決哪些場景下的老問題,恐怕才是真正有價值的。

翻看過去一年多的讀書筆記,種種跡象,不言自明:

結合人工智慧,大疆無人機的壁障能力、路徑規劃能力大幅提升。(王煜全《前哨》)

網飛的基於人工智慧的動態最佳化器新演算法,實時分析影片內容,動態調整資料傳輸速度,能讓所有使用者觀看速度變得更加穩定流暢

所以,新工具總會出現,難度總會降低,大公司總會使用新工具並且用好。

2019年2月12日更新

再來看百度EasyDL定製化影象平臺,收集資料倒是其次,演算法能解決哪些場景下的老問題,恐怕才是真正有價值的。

從外行進階專業 傳統企業AI轉型差的可能只是一個百度EasyDL-百度AI開放平臺

這篇文章了透露了三個有意思的實際應用案例。寫一篇人工智慧可以做哪些事,即便是案例堆積,估計也會很受歡迎。

標簽: 影象識別  識別  檢測  百度  人臉