收藏丨影象資料標註有哪些好用的工具
隨著AI與傳統行業的不斷融合以及5G的發展,AI資料服務方式由粗放式向著精細化方向過渡,資料標註工具的發展也經歷了從
「能用就行」
到
「好用且高效」
的階段。
大家都知道不同的標註型別使用的標註方法、工具、儲存型別都不一樣,在瞭解影象標註工具之前,我們先來看看影象標註都有哪些資料型別
影象/影片標註型別
2D框
給標註工具提供一幅影象,讓其在影象內特定物件周圍繪製一個框。
最簡單的圖片資料標註型別,成本最低,應用最廣泛。
多邊形分割
標註工具會透過在需要標註的物件的外邊緣,放置許多個點來繪製成線,勾勒輪廓。
用於圖片和影片中精確的物體檢測和位置定位,更精準、更耗時、成本更高。
關鍵點標註
透過人工的方式,在規定位置標註上關鍵點,例如人臉關鍵點、骨骼點。常用於面部或姿勢識別模型。
線標註
主要用於自動駕駛車輛的道路識別,定義不同道路。
語義分割
根據物體的屬性,對複雜不規則圖片進行進行區域劃分,並標註對應的屬性,以幫助訓練影象識別模型,常應用於自動駕駛汽車、人機互動、虛擬現實等領域。
比較精準,耗時比較長,對圖片上的所有內容進行標註。
影片標註
以幀為單位在一系列影象中定位和跟蹤物體,多用於訓練車輛、行人、騎行者、道路等自動駕駛領域的模型。
2/3D融合標註
透過3D點雲資料,返求出2D圖片的相對位置,對點雲資料和圖片資料同時標註。
用於多感測器融合平臺的資料處理,多應用於自動駕駛場景。
標註工具推薦
·CVAT
CVAT是免費的、線上的、互動式的影片註釋工具,它的靈感來自Vatic。支援本地部署,無需擔心資料外洩。
網址
https://
github。com/opencv/cvat
標註型別
1。多邊形分割、語義分割、2D框、線標註、點標註
2。3D點雲
3。影片標註
檔案匯出格式
CVAT for video、CVAT for images、PASCAL VOC、(VOC) Segmentation mask、YOLO、COCO、TFRecord、MOT、LabelMe 3。0、Datumaro
亮點/優勢
1.支援多人協作
CVAT帶有使用者管理系統,可以建立、刪除新成員,併為成員分配不同角色。如管理員、使用者、標註員、質檢員
2.標註功能強大
能用於幾乎所有CV相關標註任務,如點,多邊形,語義分割等,並且包含了插值標註即一個影片中若干幀,標註起始幀中間會自動生成、 帶有標註任務列表的儀表板等功能
3.預處理功能
使用TensorFlow OD API的自動標註,可以預處理一部分資料
4.持續更新
開源環境較好,工具在不斷完善中,有任何問題可以在gitchater問,回覆很快
不足
1。沒有「貝塞爾曲線」,只能一個一個點
2。只適用於谷歌瀏覽器,在其他瀏覽器中表現不佳
3。儘管 CVAT 支援一些自動測試,但所有質檢都必須手動完成
4。由於Chrome Sandbox的效能限制,CVAT在某些用例中可能會出現效能問題
·VOTT
微軟釋出的一款基於javascript開發用於影象目標檢測的標註工具,使用React+Redux進行開發,支援Windows和Linux平臺執行。分為V1和V2兩個版本,目前V1已經廢棄,V2是V1版本的重構和最佳化,建議大家直接用V2。
網址
https://
github。com/microsoft/Vo
TT
標註型別
支援點、線、2D框、語義分割與影片資料標註
檔案匯出格式
CNTK/Pascal VOC、TFRecord、CSV、VoTT等格式
亮點/優勢
1。安裝方便,直接下載exe檔案即可
2。VoTT的學習成本低、上手快
不足
1。不支援多人協作
2。VoTT的標註會超出影象的最大畫素範圍,如果模型對座標有規定範圍的話,則需要進行特定處理
3。資料無法加密儲存,不適合私密資料標註
4。不能匯入已有的標註結果(如bbox)
5。程式不穩定:VoTT是桌面應用,經常宕機,經常會報錯
·Labelme
Labelme 是一個圖形介面的影象標註軟體。其的設計靈感來自於
http://
labelme。csail。mit。edu/
。它是用 Python 語言編寫的,圖形介面使用的是 Qt(PyQt)。
網址
https://
github。com/wkentaro/lab
elme
標註型別
1。多邊形分割、語義分割、2D框、線標註、點標註
2。影片標註
3。對影象進行進行 flag 形式的標註(可用於影象分類和清理)
檔案匯出格式
JASON、VOC與COCO
亮點/優勢
1。使用者定製介面
2。支援全面標註方式:與labelImg相比,labelme除了矩形框之外,還可以使用圓形框,多邊形框,點,線等來對影象進行標註,用於目標檢測、影象分割等任務
3。可以對影象進行flag形式的標註,用於影象分類和清理任務
·LabelImg
LabelImg是圖形影象標註工,用Python編寫的,並將Qt用於其圖形介面,可以用於進行目標檢測專案的標註工作。
網址
https://
github。com/tzutalin/lab
elImg
標註型別
2D矩形框,目標檢測
檔案匯出格式
PASCAL VOC 、YOLO 、CreateML
亮點/優勢
1。操作簡單快速,而且生成的標註檔案以XML檔案儲存,讀取方便,格式標準
2。支援VOC2012格式與tfrecord自動生成
不足
支援的標註型別少:僅支援2D框標註
·VIA-VGG Image Annotator
一款開源的影象標註工具,由Visual Geometry Group開發。可以線上和離線使用。可標註矩形、圓、橢圓、多邊形、點和線。
網址
下載地址:
http://www。
robots。ox。ac。uk/~vgg/so
ftware/via/
Github:
https://
gitlab。com/vgg/via
標註型別
1。多邊形分割、語義分割、2D框、線標註、點標註
2。Version3增加了對影片和音訊的標註
3。人臉標註
檔案匯出格式
csv和json
亮點/優勢
1。人臉資料標註提供了各種方便的操作,人臉資料標註首選工具
2。網頁原始碼開源,可離線使用還可進行二次開發,比如增加滑鼠十字線
3。標框可以複製(可前後幀複製),同樣大小可直接複製且繼承屬性,屬性面板較為清晰
4。適用多個瀏覽器:Chrome、Firefox、Safari、 Explorer、GNOME Web等
不足
多邊形工具,一旦繪製完多邊形無法增加錨點,只能調節點的位置
·Pixel Annotation Tool
影象語義分割與例項分割標註神器,互動式標註演算法思想是基於OpenCV中分水嶺演算法實現。
網址
https://
github。com/abreheret/Pi
xelAnnotationTool
也可以直接下載編譯好的二進位制檔案使用,下載地址如下:
https://
github。com/abreheret/Pi
xelAnnotationTool/releases
標註型別
語義分割與例項分割
亮點/優勢
1。快捷,半自動化,類似PS蒙版,基於OpenCV中分水嶺演算法實現
2。可以返回上一步
不足
1。標註物件若顏色分佈不均勻,軟體無法識別
2。如果識別出來,大機率覆蓋掉周圍物體,很難修改
·Vatic
Vatic是一個帶有目標跟蹤的半自動化影片標註工具,適合目標檢測任務的標註工
網址
https://
github。com/cvondrick/va
tic/tree/contrib
標註型別
適合目標檢測任務的影片標註
檔案匯出格式
JSON
亮點/優勢
1。內含基於opencv的tracking,一段影片只需抽樣標註,大大減少了工作量
2。支援接入亞馬遜的眾包平臺Mechanical Turk,具體使用時,可以設定要標註的物體label,比如:水果,人,車,等等,然後指派任務給到眾包平臺
3。簡潔使用的GUI介面,支援多種快捷鍵操作
不足
僅支援2D框標註。
資料標註
資料是公認數字時代的石油。為了更好地對資料資源進行管理和開發利用,發揮資料資源的價值,國家定會加快培育資料要素市場,發揮資料生產要素的作用,啟用資料要素潛力,進一步完善資料生態,編制出臺培育資料要素市場的指導性檔案,資料標註行業,也將在快速發展的同時,更加規範化、制度化。