BAT影象識別產品調研

作者：由愛讀書的少俠發表于攝影時間：2019-02-07

影象識別概述

檢測與識別的區別

產品調研/競品分析

總結思考

一、影象識別概述

春節假期有空調研競品影象識別產品能力，希望能透過思考分析，預測以後兩三年的影象識別落地應用發展趨勢，看智慧視覺產品能多智慧。這是第一篇，調研業內主流的影象識別平臺提供的服務和能力。

真實世界的影象識別範圍很廣，根據識別物件的不同而劃分細分領域，比如人臉識別，商品識別，文字識別（OCR識別），還有人說色情圖識別，幾乎等同於識別萬物，也因此難度非常大，也就說識別的準確率不高。尤其是商品的識別，SKU動輒上千萬過億，即便是線下門店，超市也有一兩千個SKU，而且通常情況下還不知道是哪個商品組，需要從大的商品池裡確定這個範圍。

而對特定型別目標的識別，即垂直領域的影象識別，識別準確率還是可以的。目前研究較多的有人臉識別——我之前接觸很多，前文備述。還有商品識別，會在本篇影象識別之後，調研對比一下各家產品。

二、影象檢測與識別的區別

先說一下識別和檢測的區別。很少有人加以區分，經常有人把檢測和識別混淆使用，影響溝通。在實際工作中，確實遇到有多年工作經驗的人，不能正確使用檢測和識別，一聽就知道是新入行的。

檢測有兩層含義，最主要是對檢測物件做事實有無的判斷。

例如，人臉檢測，是檢測一張圖片中有無人臉；活體檢測，是檢測是活人還是假體；商品檢測，是檢測有無商品。

檢測的第二層含義是如果檢測結果為是，也即檢測到物件，就要回答在哪，有幾個？

提供檢測服務時，需要檢測出物件後，返回檢測物的位置和數量——一般返回兩個點的座標（例如人臉框對角線上兩個點）。返回的位置和大小，後續才好進行影象採集的工程化。

例如人臉識別的前提，就是人臉的檢測和採集，檢測的時候除了能夠返回人臉的位置和數量，還能同時輸出人臉關鍵點、人臉影象的質量如何，質量通常包括亮度、模糊度、完整度、3D空間姿態角度，以及遮擋程度——這些統稱為人臉質量檢測。

為什麼要做人臉質量檢測？因為它對識別有著重要的意義——輸入高等質量的人臉照片進行識別，能夠相當程度保證識別的準確性。

檢測是輸出有沒有，而識別的含義就是，有的話，是什麼。

例如，你發現前面走來一個美女，走近一看原來是你老婆。這裡就發生了一次檢測（有個美女）和一次識別（是你老婆）。

三、影象識別產品調研/競品分析

本次產品調研分析，除了選取BAT，還選取了另外四家公司：碼隆科技，華為，AI Fastion，YI Tunnel 。這幾家搜尋廣告軟文通稿，吹得很厲害。

經過調研發現，各大人工智慧平臺廠商目前提供的服務如下：

結論1：初步總結，碼隆科技和YI Tunnel影象識別垂直領域，商品識別的積累較多。而BAT未公開宣傳，甚至阿里也沒有，但商品識別的應用，線上部分肯定是有的，線下部分可能剛起步。

結論2：各家主要按識別物件不同將影象能力進行區分，1-4都在做的是場景識別。

結論3：影象處理和稽核與識別，阿里將鑑黃放在影象識別範疇，百度是影象稽核。而稽核結果就是透過、不透過，其實是檢測結果。

BAT影象識別能力一覽

透過能力對比發現，百度在影象識別落地應用的探索上走得更遠。

百度將影象識別按細粒度不同和定製化區分能力，水平領域和垂直領域都有所涉及，作為開放平臺，還推出了定製化影象識別平臺，也就是讓使用者上傳影象資料並進行標註、自動化完成演算法模型訓練的一個平臺，該平臺透過API/SDK提供演算法服務。

車輛檢測與識別，注意看圖中的雷達

值得一提的是，大家都知道百度在做無人車，百度門口就停了幾輛。針對車輛的識別與檢測，除了可以用在城市大腦、智慧城市等城市智慧化管理解決方案中，還可以與自動駕駛結合使用，提升道路行車的安全性。

相比之下，騰訊和阿里提供的服務則相對比較單一。

下面三張圖是BAT具體各個介面的能力介紹，為了提煉出關鍵資訊，我將所有的API介面文件都精讀了一遍。

百度影象識別能力：通用和細粒度影象識別

百度影象識別能力：車輛分析

騰訊的影象識別服務

阿里影象識別服務

下面是影象識別能力的應用場景和解決的問題，資訊整理自BAT平臺官網對外介紹。

影象識別應用場景和案例

看完之後是平淡無奇，不過如此。

不過上述場景總結了當前的影象識別，更多的落地場景在線上。這也很正常，網際網路公司首先解決的是線上業務問題。而其實結合影象做線下的問題解決，還有很大想象空間。百度做車輛識別，依圖做人臉識別，還有領域的落地應用目前還未產生大的價值和廣泛關注。

四、總結思考

影象識別技術如何產生創新和價值？

例如線上下門店場景，影象識別可以做缺貨檢測，可以透過影象採集保質期資訊、做臨期食品監察，等等。雖然都是痛點，但沒有解決特別重大的問題，或者說產生顛覆性、革命性的價值，都是做非常細微的功能點。

大家有點沮喪，覺得殺雞焉用牛刀，人工有點不智慧。於是我們認為自身缺乏一線經驗，和洞察的大智慧。

直到看到羅振宇在跨年演講中的論述：

世界上有很多創新，不是往前、往沒有人的陌生地方走，其實是在往回走。只要你能用新辦法把老事情再做一遍。其實創新一直都存在一個穩定的路徑——若不能進入傳統，則無法新增新事物。

創新就是解決老問題，新增新事物。再來看百度EasyDL定製化影象平臺，收集資料倒是其次，演算法能解決哪些場景下的老問題，恐怕才是真正有價值的。

翻看過去一年多的讀書筆記，種種跡象，不言自明：

結合人工智慧，大疆無人機的壁障能力、路徑規劃能力大幅提升。（王煜全《前哨》）

網飛的基於人工智慧的動態最佳化器新演算法，實時分析影片內容，動態調整資料傳輸速度，能讓所有使用者觀看速度變得更加穩定流暢

所以，新工具總會出現，難度總會降低，大公司總會使用新工具並且用好。

2019年2月12日更新

再來看百度EasyDL定製化影象平臺，收集資料倒是其次，演算法能解決哪些場景下的老問題，恐怕才是真正有價值的。

從外行進階專業傳統企業AI轉型差的可能只是一個百度EasyDL-百度AI開放平臺

這篇文章了透露了三個有意思的實際應用案例。寫一篇人工智慧可以做哪些事，即便是案例堆積，估計也會很受歡迎。

標簽：影象識別識別檢測百度人臉

上一篇:keyshot中產品如何佈置燈光，會使物體看起來有效果?

下一篇：光線從二倍焦距外不平行於主光軸的光線，折射光線咋畫？

BAT影象識別產品調研

猜你喜歡

人不要臉，天下無敵！

貓傳腹pcr核酸檢測有必要嗎？

怎樣把圖片中的文字和數字提取出來？

58同城怎麼徹底刪除已刪除的釋出資訊？

人臉識別技術的1:1和1：N模式有什麼區別？