寒武紀推首款邊緣AI晶片!雲邊端全家桶齊了,加速卡不到2000元
芯潮(ID:aichip001)文 | 心緣
芯潮11月14日報道,深圳高交會期間,AI晶片獨角獸寒武紀推出面向邊緣智慧計算領域的AI晶片思元220(MLU220)及M。2加速卡產品,加速卡售價1999元。
邊緣通常與各類感測器相連,而感測器的資料往往是非結構化的,比如影片,影象和語音,很難直接用於控制和決策。因此需要邊緣AI計算將非結構化資料進行結構化,用於控制和決策。為此,寒武紀專門設計了針對邊緣AI計算的晶片。
至此,寒武紀AI晶片在雲、邊、端實現全方位、立體式覆蓋。
01、峰值32 TOPS,功耗僅10W
思元220是一款專門用於深度學習的SoC邊緣加速晶片,採用臺積電16nm工藝,尺寸為15mm x 15mm,基於寒武紀最新一代智慧處理器MLUv02架構,峰值算力達32 TOPS(INT4),功耗僅10W,並且支援透過低功耗技術,將功耗進一步降低。
思元220高效能低功耗設計,主要得益於思元220採用了寒武紀最新一代的處理器架構MLUv02。
MLUv02架構基於片上網路NoC構建,有六大方面的提升和最佳化:
(1)提升單核效能,
透過重新設計運算電路,運算指令的能效大幅提升,單核算力提升8倍;
(2)節省記憶體和頻寬,
增加資料壓縮和解壓縮指令,大幅節省記憶體容量和訪存頻寬;
(3)高度靈活,
指令集擴充套件近百條,功能更強大更靈活;
(4)精度可選擇
,除了INT8,還增加INT4和INT16精度的運算指令,可根據需求靈活選擇,在高效能的場景使用更高效能的INT4,在高精度的場景,使用更高精度的INT16;
(5)增加了軟體可管理的共享快取,
可以用軟體直接控制在處理器核之間進行通訊,利用內部Shared Mem大大最佳化多核效能;
(6)方便處理複雜資料,
增加了靈活的轉置等指令,可以支援各種複雜的資料預處理。
另外,思元220內建高效能CPU 4核ARM A55,主頻為1。5GHZ,並集成了豐富的外設介面,包括:
(1)2個PCIe3。0 2×2介面,可以連線NVMe等各類高速裝置;
(2)eMMC5。1 HS400,支援高速eMMC儲存,最高達400 MB/s;
(3)SDIO3。0, 可以方便連線各種儲存裝置和WIFI 藍芽等無線裝置;
(4)雙千兆乙太網口,可以幫助客戶實現雙網口的方案,從而實現內外網物理隔離,保護資料安全;
(5)LPDDR4X記憶體介面,保證計算資料高速互動和低功耗。
隨著5G與AI時代的到來,海量資料處理需求推動AI硬體向邊緣擴充套件。寒武紀副總裁劉道福認為,邊緣計算主要帶來三個優勢:一是直接在邊緣處理資料,大幅降低通訊成本;二是大幅降低時延,解決實時處理需求;三是保護資料隱私安全,無需將資料傳回雲端,減少資料洩漏。
對此,MLU220邊緣方案有三大優勢:
(1)資料高安全:
資料本地智慧處理,脫敏上傳。
(2)處理低延時:
資料實時分析,結果即時反饋。
(3)頻寬高利用:
資料邊緣清洗,智慧分發,有效上傳。
02、超小尺寸加速卡,僅隨身碟大小
基於思元220,寒武紀面向市場推出小尺寸M。2加速卡,未來還會推出更高算力的產品形態。
思元220-M。2邊緣加速卡在尺寸僅隨身碟大小的卡片上,算力達到16 TOPS(INT4),功耗僅8。25W,可提供8路高畫質影片的實時智慧分析。
該加速卡廣泛應用於智慧交通、智慧電網、智慧製造、智慧金融、無人機、工廠質檢、智慧教育、智慧醫療、智慧零售等邊緣計算場景,並支援視覺、語音、自然語言處理及傳統機器學習等多種AI應用。
客戶可透過標準的M。2介面快速部署到已有業務中,實現業務的智慧升級和邊緣加速解決方案。
思元220晶片和板卡不僅有高算力、低功耗、小尺寸的特點,還有成熟的軟體棧和軟體生態。
寒武紀的雲、邊、端晶片都採用統一的處理器架構和指令集,以及統一的軟體棧,這三個領域的生態可以相互促進,形成正迴圈。
雲端提供了完整的開發、除錯、調優的軟體,雲端開發好的程式,可方便快速部署到終端和邊緣,解決終端和邊緣開發難、除錯難、調優難的問題。而終端和邊緣可以積累大量的客戶和開發者,反哺於雲端生態,最終實現雲、邊、端生態的繁榮。
具體到思元220,軟體棧已經在雲端進行了兩代產品的打磨。透過端雲一體的軟體平臺,思元220將繼續支援寒武紀Neuware軟體工具鏈,支援業內TensorFlow、Caffe、MXNet、PyTorch等各主流程式設計框架。
其BANG Lang。程式設計環境可對計算資源做直接定製,滿足多樣化AI定製需求。
寒武紀方表示,面向未來邊緣計算、自動駕駛車載計算、訓練等不同場景,寒武紀將持續投資,推出更多AI處理器,面向全場景持續提供更先進靈活、快速高效、效能卓越的AI算力產品及服務。
03、思元系列晶片的四點優勢
在本屆高交會期間,寒武紀展出了最全思元系列AI晶片產品,包括面向雲端的思元100和思元270、面向邊緣的思元220。
今年6月,寒武紀釋出中文品牌“思元”及第二代雲端AI晶片思元270。去年寒武紀推出雲端AI晶片品牌MLU(Machine Learning Unit)及第一代雲端AI晶片思元100。
整體來看,寒武紀思元系列有如下四點共同的優勢:
1、通用性好
通用智慧處理器,支援各類深度學習技術,支援多模態智慧處理(視覺、語音和自然語言處理),應用領域廣泛。
2、端雲一體
率先提出“端雲一體”的智慧處理思路,徹底打通端和雲的智慧處理,終端和雲端晶片可共享同樣的軟體介面和完備生態。
3、高能效
相比GPU處理器,採用了針對深度學習和人工智慧應用特點定製的指令集和處理器架構,具有更優的能效比。
4、完善的軟體開發環境
寒武紀為思元系列提供了一整套成熟的開發環境Cambricon NeuWare,具體包括應用開發、功能除錯、效能調優等在內的一系列工具。
04、結語:填補國內邊緣端加速缺口
從2018年5月釋出第一代雲端AI晶片思元100至今,寒武紀已完成覆蓋雲(思元100、思元270)、邊(思元220)、端(寒武紀1A、1H、1M處理器IP)的完整AI晶片佈局,並在多場景實現廣泛應用。
此次新推出的思元220,為國內邊緣端加速市場又增添了一個新選擇。