行業新聞 (News) 芯片封裝主頁/ 行業新聞 / Nvidia Chip將深度學習推向了極致
< 返回列表

Nvidia Chip將深度學習推向了極致

毫無疑問,GPU-powerhouse Nvidia希望能夠為各種規模的AI提供解決方案 - 從大規模數據中心工作到始終在線的低功耗神經網絡,可以監聽語音助理中的喚醒字。

所以現在,它將采用不同的技術,因為它們都沒有擴展或縮小特定的井。顯然可以部署。試圖回答這個問題: “你能構建一些可擴展的產品...... 同時在整個頻譜范圍內保持競爭性的每瓦性能嗎?”

上個月在京都舉行的VLSI研討會上,Nvidia詳細介紹了一項微小的測試,該測試可以獨立完成低端工作,也可以與其中最多36位親屬緊密聯系。它實現了它,同時實現了大致相同的頂級性能。

工程師通常在可以實現的許多加速器中測量這種“推理”芯片“推理”芯片的性能。與其他組的先前原型相比,使用相同芯片的芯片,每秒4.01 tera-operations(每秒1000億次操作)和每秒每秒1.29 TOPS(每秒1000億次操作)但是連接到一個36芯片系統它達到了127.8 TOPS。這是一個32倍的性能提升。(不可否認,一些效率來自未處理更高精度的數學,某些,問題,DRAM問題,和其他形式的AI蜜蜂卷積神經網絡。)

例如,加利福尼亞州Irvine,?-Startup Syntiant?在閃存中使用模擬處理,以提高極低功耗,低需求應用的性能。高手谷歌的公司真正調整了他們的技術,以便為他們的特定利基做最好的工作。?張量處理單元的功率將被浪費在除數據中心的高性能,高功率環境之外的任何其他地方。

通過這項研究,Nvidia試圖證明一種技術在所有這些情況下都可以很好地運行。或者至少它可以在多芯片模塊中與Nvidia的網狀網絡連接在一起。事實上,多個集成電路可以被視為一個大型IC。它們正變得越來越流行,因為它們允許系統可以包含在幾個小芯片中 - 通常稱為小芯片-而不是c。

“多芯片模塊選項不僅對于未來可擴展的[深度學習]加速器具有很多優勢,而且對于構建具有不同功能的加速器的產品版本具有很多優勢,”Dally解釋道。

GRS利用Nvidia多芯片模塊綁定到新深度學習芯片的能力之間的差異,作為使用稱為地參考信號的技術的芯片間網絡。它可以使用單根線傳輸25千兆位/秒,而大多數技術都需要配對這些線。更重要的是,GRS的功耗僅為每比特的微笑。

“這是我們開發的一種技術,基本上可以選擇在有機基板上構建多芯片模塊,作為硅中介層的一個機會,這是一種更昂貴的技術,”Dally說。

Dally說他們已經完成了該芯片的TOPS / W版本。“我們相信我們可以做得更好,”他說。渴望找到加速技術,使VLSI原型的9.09 TOPS / W達到200 TOPS / W,同時仍然可擴展。

· 2019-07-04 23:19  本新聞來源自:ieee,版權歸原創方所有

閱讀:995
  • 聯系長芯

    重慶總部:重慶市長壽區新市街道新富大道5號佳禾工業園8棟2層
    電話:023 40819981 (前臺)

    深圳辦事處:深圳市南山區留仙大道 1213 號眾冠紅花嶺工業南區 2 區 1 棟 1 樓
    電話:0755-26975877 (前臺)

    電子郵件:[email protected]

    網址:http://www.zduwgp.live

  • 三重魔力登陆