從英特爾支援DE超聲機器人開發，看人工智慧在醫療影像領域的價值和機遇

作者：由新智元發表于攝影時間：2017-05-01

醫療影像智慧分析在智慧醫療各領域中都屬於發展較快的一支。國內外湧現了一批將 AI 技術應用於醫療影像識別和分析的初創公司。然而，在具體的技術落地過程中，這些公司往往會遇到一些特定的難題。在此，我們和大家分享一個在英特爾技術支援下，由浙江大學數理學院和浙江德尚韻興影象科技有限公司成功開發的智慧醫療影像診斷系統的案例。該系統的任務是識別和分析影像中的甲狀腺結節以及良惡性。從這一案例中，可以看到，英特爾系統化的計算硬體和所支援的豐富的計算結構和框架，為開發者快速開發提供了有力武器，並且與其生態環境合作伙伴密切配合，為技術的普及和業務模式的發展提供了強力支援。

醫療影像資料快速增長，引入人工智慧技術成必然

人工智慧和醫療影像的結合已經成為一個比較熱門的研究和創業方向。除了以深度學習技術驅動的計算機影象識別能力的大幅提升之外，醫療影像資料的快速增長也是重要原因。

醫療大資料中有超過 80 % 的資料來自於醫療影像。這些資料大多要進行人工分析。目前我國醫學影像資料的年增長率約為30%，而放射科醫師數量的年增長率約為 6。1%，其間的差距是 23。9%，放射科醫師的數量增長遠不及影像資料的增長。這意味著放射科醫師在未來處理影像資料的壓力會越來越大，甚至遠遠超過負荷。

同時，醫療影像的多樣性也在不斷增強，已經從常見的以灰度為主的 X 光片、CT、 MRI、B 超等發展到結合了其他動力學、醫學解剖學等特徵的計算機合成的彩色、多維影像圖片，以及各種數字檢查鏡產生高解析度影象，如眼底照片、病理影象等等，以及在影像以外再加上治療資料、基因資料、預後資料以及影像時間維度的擴充等結合，多模態影像、病理、檢驗、基因及隨訪資訊等資料的種類繁多。

然而長期以來，人工鑑別影象幾乎是醫療機構唯一在使用的方式，對醫師的經驗、狀態都有著極大的依賴，加之人眼的解析度和敏感度限制，客觀上制約了對影像資料的充分利用。影像科醫師較長的培養週期，也對基層醫療機構承擔起分級診療政策指導下的疾病初診都造成了一定壓力。

當然，也要看到，儘管資料量如此巨大，且多樣性極強，但因為醫療影像資料的標準化、結構化和統一性在整個醫療資料中仍然是最強的，再加之以深度學習技術驅動的影象識別本就處在這一波 AI 技術應用浪潮的最前沿，這使得醫療影像智慧分析在智慧醫療各領域中都屬於發展較快的一支。國內外湧現了一批將 AI 技術應用於醫療影像識別和分析的初創公司。然而，在具體的技術落地過程中，這些公司往往會遇到一些特定的難題。

在此，我們和大家分享一個在英特爾技術支援下，由浙江大學數理學院和浙江德尚韻興影象科技有限公司成功開發的智慧醫療影像診斷系統的案例。該系統的任務是識別和分析影像中的甲狀腺結節以及良惡性。根據實測，國內比較頂級的三甲醫院 10 年資質的放射科醫生判斷準確性平均在 75% 左右，而目前雙方合作開發出的系統-DE 超聲機器人的準確率則能穩定在 85% 以上，在實驗室則達到 90% 以上。並在包括浙江大學第一附屬醫院的醫療機構已經實際應用，服務了幾千名患甲狀腺結節的病人。

DE 超聲機器人的用途、優勢和價值

浙江大學數理學院和德尚韻興公司的聯合開發團隊針對目前人群中高發的甲狀腺結節的智慧讀片和分析需求，研發了基於深度卷積網路 DNN 的演算法，可對超聲醫學影象病變區域進行識別和判斷。深度學習可以模仿人腦的機制來提取醫學影像的特徵，形成更加抽象的高層特徵來進行分類或識別物體。傳統的機器學習方法是由專業人員來定義結節或腫瘤的特徵，如鈣化、邊緣、毛刺、灰度等，利用特徵組合來表示目標屬性或類別。由於影響因素十分複雜，人工定義特徵難度高而且效果也比較有限。深度學習能自動學習具有層次結構的特徵，如淺層次特徵：邊緣、灰度、角、回聲、鈣化、形狀等；深層次特徵：複雜紋理。透過特徵學習準確的實現對目標的識別和分類。同時，結合分割技術、檢測與識別技術，透過來自大量不同醫院、不同品牌、不同型號的超聲機採集的超聲影像資料來訓練網路結構，開發出了超聲醫學影像智慧診斷系統——DE 超聲機器人。

功能說明：

功能一：甲狀腺結節探測與識別

無需醫生干預，便可從原始的甲狀腺超聲圖片中快速地勾畫出所有結節的輪廓。

功能二：甲狀腺結節良、惡性診斷

對超聲圖片中每個結節分別自動、快速地診斷其良、惡性。

為了更好的驗證 DE 超聲機器人對醫生診斷的支援效果，研究團隊與某國內排名前十的三甲醫院超聲科進行了讀片對比，分別遴選出十年資和兩年資以上的超聲醫生與DE 超聲機器人的讀片結果進行比對，以病理報告的結果（金標準）為依據。競賽結果表明，資深超聲醫生的識別準確率平均約為75%，而超聲機器人則穩定在 85% 以上。

開發過程中的挑戰，及基於英特爾領先AI技術的解決方案

在研發過程中，研發團隊遇到了如下挑戰：

1。原有訓練平臺使用了 GPGPU 產品，片上記憶體僅有 8GB，而每次訓練需要匯入記憶體的資料超過 12GB，經過大量重新設計網路、最佳化計算框架、壓縮資料集等方法，將記憶體需求降低到 6GB，但是最終的效果受到了影響。

2。最初設計了工作站和雲版兩種部署模式，並實現了工作站平臺版本，但未能應用 MKL 加速，單張影像分析時間較長，為後續處理連續 B 超影像帶來效能瓶頸。雲版需要考慮多使用者管理並且在結合醫療機構正常甲狀腺管理方面做好整合，工作量較大一直沒有開始。

3。在甲狀腺 B 超取得顯著進展的同時，也開始了乳腺癌、腹部 B 超、頸動脈斑塊等其他方向的研究，原平臺最多 4 卡限制了研究效率。

英特爾與浙江大學數理學院、德尚韻興公司一起實現了以下重要進展：

1。共同將模型訓練從 GPU 四卡系統遷移至 Intel Xeon Phi 7250 四節點平臺，經過最佳化單節點效能約為元平臺處理速度的1。1 倍。

2。共同將預測模型用英特爾的 MKL2017 最佳化，在 CPU 平臺的評分速度預計獲得 8X 以上提升。

3。共同改進演算法準確度，進一步提高影象識別的精度。

4。引入英特爾醫療生態鏈合作伙伴經綸世紀，共同將基於單機的 DE 診斷系統升級為雲服務方案，並部署在阿里雲平臺，支援在浙大醫院超聲科的實時業務。

5。與經綸世紀依照美國甲狀腺協會指南的甲狀腺風險度評估與管理系統整合，併成功推廣到面向 2000 萬人口的中國健康促進基金會全國篩查專案。

英特爾人工智慧系統化解決方案

圖四：深度學習步驟示意圖

英特爾秉承人工智慧大眾化的理念，致力於不斷推出易於部署和開發，高效能的深度學習平臺。英特爾的深度學習體系分別對針對訓練和評測兩個環節進行了最佳化，共享共同的基礎架構和開發環境，使得開發、維護、程式碼複用等大大簡化。

圖五：英特爾深度學習系統化解決方案

英特爾深度學習訓練伺服器

英特爾的深度學習平臺可以基於 Xeon 或者 Xeon Phi 眾核處理器來構建。其內建了諸多模組，使開發者進行機器學習開發更加容易。英特爾開發了深度學習加速函式加強它廣泛應用的 MKL （Math KernelLibrary）數學庫，並透過 DAAL （Data Analytics Acceleration Library）資料分析加速函式庫提供分散式機器學習功能，它對基於 IA 的硬體平臺進行了深度最佳化。這兩個庫都可以透過“社群許可”免費獲得。

英特爾還提供了基於 Intel Xeon 處理器和 Intel Xeon Phi 處理器的 Caffe，Theano，Tensorflow 等深度學習主流框架的最佳化整合包（Caffe Optimized Integration for Intel Xeon 和 Intel Xeon Phi）。英特爾全路徑架構（Intel OPA，Intel Omni-Path Architecture）和 Xeon Phi Knights Landing 處理器支援超高速互聯計算節點叢集。新的智慧方法，可以將深度神經網路訓練擴充套件到大量處理節點上，從而在目前最優的基礎上顯著減少了訓練時間。例如，使OverFeat-FAST 深度神經網路拓撲結構，已經有研究機構在目前 64 個節點的 Intel Xeon E5-2697 處理器上將訓練時間降低到了 8 小時，使用Knights Landing 平臺會將時間降低到 3-4 個小時。

基於 Xeon Phi 眾核處理器的訓練伺服器可以克服片上記憶體對計算規模和網路深度的限制，並且作為自啟動處理器，可以直接訪問主存，顯著提高計算效率。當搭建大規模的訓練叢集時，128個節點的 Xeon Phi 可以達到 50倍以上的速度提升。

浙大數理學院最早選擇了 ConvNet 在 GPU 平臺上進行模型訓練，因為大量 B 超影像的資料對記憶體要求較高，他們在 ConvNet 上做了深入最佳化和壓縮使對記憶體的佔用從 12G 降低到 6G，使得演算法得以執行完成，但是對精確度和計算效率都造成了一定的影響。轉入 Xeon Phi 平臺後，記憶體的限制被移除，除了處理器帶有高達 16G 的片上記憶體，單個節點可直接訪問的主存空間也高達 384G。

研究團隊採用瞭如下配置的 Xeon Phi 的訓練伺服器：

在單個節點 Xeon Phi 平臺使用 IntelCaffe 以及 MKL2017 的最新版本，經過調優後，速度提高到2 倍，在 ResNet101 和 ResNet50 的測試中，甚至達到對比組 M40 的效能的 1。2 倍。

英特爾人工智慧評分系統加速方案

浙江大學數理學院和德尚韻興公司的聯合開發團隊初期為了將在GPGPU 上訓練好的模型部署於工作站或者雲端，基本上重新編寫了全部實現程式碼，並且進行了深度最佳化，單幅影象的處理時間一直在30 秒左右。這在開始階段可以接受，但是 B 超本身產生的是連續影象，這使得連續處理時間幾十倍的增加，並且增加了其他病種後時間會變得更長，產品化和商業化的時間都受到影響。

聯合開發團隊裝了數學核心庫的最新最佳化版本 MKL2017 以後，開啟並行化選項，在不改變程式碼的情況下就已經獲得 2 倍以上的速度提升，經過深度最佳化，速度提高到 10 倍左右。這些最佳化由於得到基於統一的 IA 架構的支援，無論是在工作站方案，還是雲版方案，都同樣得到了效能的顯著提升。

與此同時，雲服務商將 MKL 部署於其計算環境，即可對其客戶的應用進行加速。

“只要是計算，英特爾就是最好的”。英特爾醫療與生命科學集團亞太總經理李亞東如是說。

與生態系統合作伙伴一起發揮 DE 超聲機器人的應用價值

英特爾積極聯合生態環境產業合作伙伴，推動人工智慧研發成果產品化，探索有效的業務模式，為行業提供從方案架構到業務流程的參考案例。

在浙大醫學院附屬第一醫院超聲科的部署，得到了幾位主任的高度評價與支援。超聲機器人作為初步的篩查工具，可以避免醫生花費大量時間檢視比較簡單的影象，集中精力於複雜案例，也可以有效的降低漏診、誤診等問題。蔣主任介紹說，超聲科的醫生工作負擔非常重，每天可能要書寫數百份超聲報告，很多雖然基本但是很耗費時間，經過長時間的工作，醫生的準確率可能會受到影響。引入超聲機器人作為助手，醫生只需要複核，經過標註的可疑區域也非常直觀，提高了效率，作為培養年輕醫師的手段也很受歡迎。

位於杭州的另外兩所社群衛生院基於阿里雲部署的超聲機器人，也深受當地醫生患者好評。之前由於基層的醫生經驗有限，很難及時給出報告，現在只需要數秒，超聲機器人就可以自動生成一份詳細的參考報告模板。既可以全自動地探測結節區域、識別結節的良惡性，也可以透過人工勾畫出結節區域，然後系統自動識別其良惡性。

英特爾與醫療機構一起推進先進技術在的普及和應用，惠及更大量人群，參與到中國健康促進基金會的全國甲狀腺結節檢查與風險度評估專案，並與執行單位經綸世紀一起與超聲機器人緊密整合，並利用阿里雲的覆蓋網路和線上儲存服務，將業務應用推廣到數百家體檢中心，將會覆蓋每年參檢的 2000 多萬人群。

在以往人工智慧線上服務模式中，作為服務提供方的機構往往會遇到雲服務公司的平臺對人工智慧演算法的支援較弱，關鍵演算法需要重新設計，加速卡等方案昂貴而且由於雲服務公司的平臺管理機制無法使用，造成無論是線上效能、最佳化、維護成本都不夠理想。

阿里雲將對人工智慧應用的平臺化支援作為重要的建設目標，與英特爾緊密合作，從通用計算硬體（Xeon，Xeon Phi 等）選型到計算加速庫、大資料分析加速工具的整合與最佳化做了大量工作，並且透過一系列安全強化措施增強了使用者對資料上雲的信心。最終線上版本的計算效能較為理想，直接將在本地最佳化好的應用遷移到雲的過程很平滑，終端使用者（超聲科醫生）的反饋也對響應和計算速度滿意。在 2000 萬人群的全國篩查專案中，集中體檢對線上平臺的壓力較大，高峰時期可以達到 300-500 例併發線上評分診斷，而響應時間並沒有顯著延長。

英特爾與合作伙伴在人工智慧在醫學影像的開發和應用的探索實踐，為將來引入更多病種的檢測與診斷，充分發揮人工智慧在影像識別的獨特優勢，提高診斷的質量和效率，起到了非常有效的推動。而英特爾系統化的計算硬體和所支援的豐富的計算結構和框架，則為開發者快速開發提供了有力武器，並且與其生態環境合作伙伴密切配合，為技術的普及和業務模式的發展提供了強力支援。

本文由新智元報道，作者張易。

標簽：影像超聲英特爾 Xeon 深度

上一篇:魔道祖師中男主之一魏嬰魏無羨，如果有個妹妹，應該叫什麼名字？

下一篇：工業設計有沒有類似這樣的書?