讓天下沒有難訓練的缺陷檢測模型
我們身處什麼浪潮之中?
“小公司”上《新聞聯播》
新聞聯播報導微億智造質檢機
微億智造的產品第一次上《新聞聯播》時,成立不到兩年。為什麼這家“小公司”可以做到這點?
核心矛盾
我國製造業面臨的核心矛盾:雖然我們希望繼續向全球輸出高性價比的產品,但是人口紅利消失導致製造成本持續快速上升。很多工廠都面臨招工難、招工貴的難題。如何處理這個矛盾?我們說,需要藉助技術,提高人效比。
表面缺陷檢測
微億的質檢機入駐工廠之前,工件的表面缺陷需要靠質檢員用手翻轉工件、用眼睛檢查工件上的例如裂紋等缺陷。這一個工件檢查完畢後,再拿起下一個。質檢員的每一次處理工作,無法複用,只能枯燥地重複;
質檢機入駐工廠後,曾經的質檢員成為了標註員,將他們對錶面缺陷的認知透過工具轉化為深度學習的模型。這一批工件的缺陷標註完畢後,只要缺陷的定義不發生變化,質檢工作可以完全由質檢機自動化完成。
結果就是,人效比顯著提升。
微億智造質檢機為工廠降本增效
我們如何在浪潮之中順勢而為?
挑戰
深度學習在表面缺陷檢測任務中面臨的挑戰:
小樣本量快速啟動(客戶攤攤手:我就這麼多資料,你看著辦吧)
持續更新的缺陷定義(客戶搖搖頭:我們工藝就是會不斷升級的,缺陷檢不出來,你等著瞧吧)
原則
現場有神靈,信任現場工程師;
用工具將現場工程師武裝到牙齒;
量化目標指標,持續迭代最佳化。
策略
1)人最重要
我們的現場工程師,是一批資深的標註員,他們當中有些人曾經是工廠的質檢員。他們的職責是:訓練深度學習模型,部署到質檢機,並對模型的質量負責。
有人就會問了,這些現場工程師,不懂深度學習演算法的技術細節,可以對模型質量負責嗎?
我們的回答是,是可以的,而且必須由他們負責。
深度學習領域有個不成文的“二八原則”:對於理論比較成熟的領域,例如目標檢測,模型質量“二成靠演算法,八成靠資料”。標註資料的唯一用途是用於訓練深度學習模型。如何量化標註資料的質量?最直接有效的方式就是看由這批資料訓練而成的模型質量。
所以說,對模型質量負責的人,必須對標註資料質量負責;而如果寄希望於一個人只對標註數量負責,而卻對模型質量毫無理性認知,這種希望只會落空。因為他無法透過客觀的量化指標建立反饋機制,只能停留在對標註資料質量的感性認知階段,難以進入理性認知階段,更不用說主動地改造實踐,根據模型結果調整標註方式,提升模型質量了。
為標註資料質量評價建立閉環
2)打造工具
授之以魚不如授之以漁。我們將基於小樣本的快速迭代方法論沉澱為工具,並命名它為Lupinus。
自然界中,Lupinus在沙漠裡頑強生存,儘管生命短暫,只要些許雨水,就能開花結果,凋謝自己,孕育子孫;
工業現場,伴隨工藝變化,質檢需求頻繁更迭。Lupinus,讓所有明確缺陷檢出需求的人,可以快速生產深度學習模型。
Desert Lupinus
打造工具的人,各司其職,在各自的工作範疇不斷精進。在質檢專案中解決問題,沉澱方法,迭代工具;又用工具解決質檢專案中已處理過的問題,加快專案執行效率。至此,正向飛輪得以建立。
協同打造工具
3)研發可以真正最佳化指標的技術
技術是什麼?我們說,是可以複用的生產要素。有用的技術,可以客觀地最佳化量化指標。
我們定義核心量化指標為可以部署到質檢機的生產工時。基於生產工序對這個工時進行分解,可以明確哪些工時可以最佳化,以及最佳化的方向。
Lupinus技術點示意圖
我們如何在浪潮之中創新?
如果從原理出發已經做了充分論證,需要堅定地相信自己的工作。自信應該來自於嚴謹的論證,而不是若干專案的得失;
需要不怕失敗的勇氣,這個勇氣來源於自信,無論失敗或者成功都需要覆盤,持續迭代。要擁抱不確定性,沒有不確定性,也沒有太多機會;
和其他部門對齊認知,僅靠邏輯是不夠的,需要的是客觀的工作成果。
我們要持續創新,和各領域的同仁一道,給國家以底氣,保留完整的工業體系。從實力的地位出發,平視任何其他國家。