安妮 編譯整理
量子位 出品 | 公眾號 QbitAI

今天凌晨,英特爾推出Movidius Myriad X視覺處理單元(VPU),它是一種低功耗系統晶元(SoC),引入了神經計算引擎(Neural Compute Engine)的新結構。

神經計算引擎是一種集成在晶元上的DNN加速器,有了它的助力,Myriad X功率低且性能強,可為無人機、相機、安全系統、VR/AR設備、360度攝像頭等設備的視覺和AI應用提供高效解決方案。

這也被視為英特爾在邊緣計算(Edge Computing)領域的重要步驟。

英特爾推出升級版VPU:引入神經計算引擎,提速10倍
一個多月前,已被英特爾收購的Movidius發布了售價僅79美元的U盤型計算棒運行神經網路,其處理內核是Myriad 2 VPU。英特爾稱Myriad X是Mariad 2的升級版,在性能上有所提升。

英特爾推出升級版VPU:引入神經計算引擎,提速10倍 上月發布的Myriad 2計算棒

Myriad X性能如何呢?

官方公布的信息顯示,Myriad X長8.7毫米,寬8.5毫米,比成年人的拇指蓋還要小。它理論上每秒可執行超過4萬億次操作,同樣的功率下,Myriad X運行神經網路的速度比Myriad 2快10倍。

英特爾推出升級版VPU:引入神經計算引擎,提速10倍 Myriad X介紹圖,左上為晶元與美元5分硬幣的大小對比

速度的提升很大程度上歸功於在Myriad X上引入的神經計算引擎。這種硬體塊讓Myriad X的DNN推理的實際吞吐量達到每秒一萬多億次運算(TOPS)。該晶元還配備了16個向量處理器處理圖像,比4個Myriad 2配置的還多,還有一個擴展的晶元內存池。

英特爾稱,這些增強的性能可以使Myriad X從8個不同的攝像頭每秒處理高達7億像素的視覺輸入,這個比拇指蓋還小的矽片也可被安裝在各類設備上。

英特爾推出升級版VPU:引入神經計算引擎,提速10倍 Myriad X與Myriad 2兩者性能對比

神經計算引擎的能力令人印象深刻,但在如此低功率下提供高性能的推理並不簡單。Myriad X主要融合了4個重要的設計元素:

靈活的SHAVE處理器:SHAVE處理器的原始性能達到了數百個GFLOPS,加速神經計算引擎的硬體固定功能。

大規模并行的中央內存:深度神經網路創造出大量的中間數據,將此放入晶元幫助用戶減少帶寬,避免性能障礙。Myriad X晶元內存設計將移動中間數據的成本降到最低。

靈活的精度:Myriad X VPU本身支持混合精度和靈活的硬體,在低功率中運行深度神經網路離不開Myriad靈活混合精度的支持。

優化的庫和框架:正在研發開發工具包中有與架構緊密相關的專用軟體庫,可支持矩陣乘法和多維卷積的持續性能。此外,裡面還包含另外一種工具,能將訓練過的PC模型自動移植到Myriad的基礎架構中。

Movidius也設想過Myriad X的應用場景,比如無人機製造商可將此集成到四軸飛行器,幫助它們識別和躲避障礙物。相機製造商可利用Myriad X自動突出顯示用戶對視頻中感興趣的部分。英特爾還將VR耳機、智能設備和機器人等列入可用處理器處理的範圍。

同時Movidius也表示,Myriad X不會取代Myriad 2,去年一月Myriad的價格已降至不足10美元,但使用了成本較高的FinFET處理和額外硬體特徵的Myriad X,將以更高的售價進入不同的市場。

從雲端走下來的人工智慧,正一步一步走入我們的生活。