五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言

首頁 > 機器人資訊 > 巨頭們的人工智能芯片研發得怎么樣了?

巨頭們的人工智能芯片研發得怎么樣了?

日期:2020-01-28   人氣:  來源:互聯網
簡介:巨頭們的人工智能芯片研發得怎么樣了? 根據百度(Baidu)深度學習(deeplearning)資深研究人員針對最新加速器進行的測試結果顯示,現有的加速器芯片和軟件仍然存在一些美中不足之處,應該盡快迎頭趕上。 這些結果有一部份來自于使用DeepBench測試。DeepB……

巨頭們的人工智能芯片研發得怎么樣了?

根據百度(Baidu)深度學習(deeplearning)資深研究人員針對最新加速器進行的測試結果顯示,現有的加速器芯片和軟件仍然存在一些美中不足之處,應該盡快迎頭趕上。

這些結果有一部份來自于使用DeepBench測試。DeepBench是使用32位浮點數學訓練神經網絡的開放來源基準。號稱中國Google的百度于2016年9月發布DeepBench,并在去年6月進行了更新,使其涵蓋推論工作以及使用16位數學運算。

DeepBench利用神經網絡庫測試不同硬件的基本運算效能(來源:Baidu)

百度硅谷人工智能實驗室(SiliconValleyAILab)資深研究員GregDaimos解釋。在一些像矩陣乘法這樣的底層作業中,具有專用硬件的芯片(例如NvidiaVoltaGPU的張量核心)能夠提供數百TeraFlops(每秒1兆次浮點運算)比前一代的5-10TFLOPS更快幾個數量級。

然而,他說:在實際應用中所使用的一些底層作業并沒有足夠的(數據)區域性,讓這些專用處理器充份發揮效能,所以我們必須為其適度地加速,或者改變算法。

百度研究小組目前正探索兩種方式使用新芯片獲得更大回報。一方面,KUKA機器人維修,研究人員在其算法中開啟控制功能,庫卡機器人驅動器維修,以便同時接收饋入數據,期望能提高10倍的資料平行性。

另一條途徑是讓所有的模型看起來更像一般用于成像應用的卷積神經網絡(CNN)。Daimos說,CNN比一般用于文本或音頻應用(app)等循序數據的遞歸神經網絡(RNN)具有更多區域性。

GregDiamosBaiduwcap

研究人員在從文本產生音頻的百度模型中,以CNN層取代RNN層堆棧,使得運算密度提高了40倍,從而帶來了更好的新硬件利用率。他強調,我們必須透過編寫的所有應用程序來檢視是否可以普遍使用這種方法,或只是將其用于語音合成。

目前尚不清楚這兩種方法的研究成果何時可用于生產系統。同時,Daimos也分享了硬件測試的其它觀察結果。

編程、內存與靈活性

雖然百度取得將近90%的NvidiaVolta最佳利用率,庫卡機器人何服電機維修,但編程GPU并非易事。Diamos說,該芯片有著成千上萬個線程,你必須在一個問題上進行協調和同步編寫這樣的程序代碼并不容易,而當面對的是像張量核心這樣的對象時就更困難了。

的確,Diamos表示,讓這些任務變得更易于編程,正是我們面臨的最大挑戰而其中最大的問題就出在內存。我們想要執行更大的神經網絡,但內存比預期地更快耗盡,這并不是透過打造更好的處理器就能解決的問題。

他補充說,該問題的一部份答案在于尋找能與新興內存搭配作業的技術,例如許多最新加速器所使用的高帶寬內存(HBM)芯片堆棧等。

在百度的測試中,英特爾(Intel)多核心x86處理器XeonPhi的利用率甚至高于NvidiaVolta。然而,英特爾的芯片還沒有任何張量專用核心,因此該芯片在神經網絡作業上的性能不若Volta。

Volta配備640個Tensor核心,每秒提供超過100TFLOPS的深度學習效能(來源:Nvidia)

直接進行比較并不容易,因為不同的芯片通常使用不同的運算格式。例如,XeonPhi采用定點數學,而Volta則混合使用16位和32位浮點運算。

Diamos說:英特爾芯片的測試結果顯示,對于一些CNN來說,定點數學運算沒問題。然而Nvidia發布的結果顯示在影像和語音應用上表現良好,所以我們取得了一些數據,但還需要進行更多研究。

他稱贊AMD最新的GPU及其新的機器學習開放軟件是正確的發展方向,但指出他們也缺乏張量核心。他表示,對于英特爾Nirvana和GraphcoreColossus等芯片沒啥可分享的消息,也許是因為百度可能還在測試其預先發布的樣片。

擁有大量的矩陣乘法單元通常是一件好事。但是,Volta、Nervana和Colossus處理器則以充滿矩陣乘法數組的芯片將其性能指針推進到或接近其工藝節點所能實現的極限。

他說:最終你的收益會遞減讓你不得不放棄靈活度,以便為更多不同的工作負載進行更精密的運算。因此,我們應該找到曲線的轉折點,讓芯片不僅在CNN上運作良好,在其它方面也表現出色。

神經網絡軟件架構各執一端

除了底層數學之外,加速器還可能缺少優化,因為它們并不完全了解深度學習應用的所有范圍。

當今用于設計神經網絡的競爭軟件架構各執一端,可能會讓情況變得復雜。遺憾的是,跨不同架構建立標準規格的努力也是各自為政,Diamos指出他的團隊注意到目前有11種開發中規格分別處于不同的完善階段。

他說,由Facebook和微軟(Microsoft)發起的開放神經網絡交換格式(ONNX)正朝著正確的方向發展,但仍缺乏一些像是如何表達控制流程和反向傳播的特性。

最近有20多家廠商(主要是半導體供應商)宣布了神經網絡交換格式(NeuralNetworkExchangeFormat),他們認為該格式對芯片廠商來說更好。Diamos說:要搞清這些格式中是否有些能成功實施可能還為時過早,但我們正踏上一條更好的發展道路,確實也需要其中某一種規格勝出。

他補充說:在2014年,我當時認為未來將會看到人工智能(AI)架構的融合,就像如今在繪圖API中所看到的,但人們仍然在發明新的神經網絡類型,有時還會創造新的原型,所以它可能會像編程語言的多樣性一樣不斷地與時俱進。

免責聲明:本網部分文章和信息來源于互聯網,本網轉載出于傳遞更多信息和學習之目的。如轉載稿涉及版權等問題,請立即聯系網站所有人,我們會予以更改或刪除相關文章,保證您的權利。
主站蜘蛛池模板: 广饶县| 长宁县| 东乡族自治县| 固安县| 濮阳市| 维西| 延津县| 河源市| 唐山市| 阳曲县| 阿城市| 巴彦淖尔市| 方正县| 出国| 卫辉市| 杭锦旗| 乐安县| 米泉市| 扶沟县| 红河县| 全州县| 长治市| 新平| 乌拉特中旗| 郸城县| 双城市| 河南省| 紫阳县| 清丰县| 松桃| 磐石市| 永寿县| 电白县| 措美县| 若羌县| 揭西县| 阿克陶县| 游戏| 基隆市| 安达市| 安多县|