讓天下沒有難訓練的缺陷檢測模型

作者：由 Alexpartisan 發表于體育時間：2022-01-26

我們身處什麼浪潮之中？

“小公司”上《新聞聯播》

新聞聯播報導微億智造質檢機

微億智造的產品第一次上《新聞聯播》時，成立不到兩年。為什麼這家“小公司”可以做到這點？

核心矛盾

我國製造業面臨的核心矛盾：雖然我們希望繼續向全球輸出高性價比的產品，但是人口紅利消失導致製造成本持續快速上升。很多工廠都面臨招工難、招工貴的難題。如何處理這個矛盾？我們說，需要藉助技術，提高人效比。

表面缺陷檢測

微億的質檢機入駐工廠之前，工件的表面缺陷需要靠質檢員用手翻轉工件、用眼睛檢查工件上的例如裂紋等缺陷。這一個工件檢查完畢後，再拿起下一個。質檢員的每一次處理工作，無法複用，只能枯燥地重複；

質檢機入駐工廠後，曾經的質檢員成為了標註員，將他們對錶面缺陷的認知透過工具轉化為深度學習的模型。這一批工件的缺陷標註完畢後，只要缺陷的定義不發生變化，質檢工作可以完全由質檢機自動化完成。

結果就是，人效比顯著提升。

微億智造質檢機為工廠降本增效

我們如何在浪潮之中順勢而為？

挑戰

深度學習在表面缺陷檢測任務中面臨的挑戰：

小樣本量快速啟動（客戶攤攤手：我就這麼多資料，你看著辦吧）

持續更新的缺陷定義（客戶搖搖頭：我們工藝就是會不斷升級的，缺陷檢不出來，你等著瞧吧）

原則

現場有神靈，信任現場工程師；

用工具將現場工程師武裝到牙齒；

量化目標指標，持續迭代最佳化。

策略

1）人最重要

我們的現場工程師，是一批資深的標註員，他們當中有些人曾經是工廠的質檢員。他們的職責是：訓練深度學習模型，部署到質檢機，並對模型的質量負責。

有人就會問了，這些現場工程師，不懂深度學習演算法的技術細節，可以對模型質量負責嗎？

我們的回答是，是可以的，而且必須由他們負責。

深度學習領域有個不成文的“二八原則”：對於理論比較成熟的領域，例如目標檢測，模型質量“二成靠演算法，八成靠資料”。標註資料的唯一用途是用於訓練深度學習模型。如何量化標註資料的質量？最直接有效的方式就是看由這批資料訓練而成的模型質量。

所以說，對模型質量負責的人，必須對標註資料質量負責；而如果寄希望於一個人只對標註數量負責，而卻對模型質量毫無理性認知，這種希望只會落空。因為他無法透過客觀的量化指標建立反饋機制，只能停留在對標註資料質量的感性認知階段，難以進入理性認知階段，更不用說主動地改造實踐，根據模型結果調整標註方式，提升模型質量了。