黃仁勳親自撰文：AI Is Eating Software

張貼日期：Jun 11, 2017 11:52:17 AM

我們正將人工智能推廣至每個計算平台、每個架構、以及人類的每項工作中。

本月，GPU技術大會（GPU Technology Conference）取得了巨大成功，向人工智能的懷疑論者充分證明了該革命性技術勢不可擋的力量。

在此次矽谷舉行的為期四天的大會裡，世界領先的媒體和娛樂、製造、醫療和運輸公司的代表們相互分享了GPU計算帶來的重大突破。

數字說明了一切。第八屆年度GPU技術大會堪稱有史以來規模最大的一次盛會，吸引了7000多名與會者和150家參展商，同時召開了600場技術會議。全球前十大科技公司，全球十大汽車製造商，以及100多家專注於人工智能和VR的初創公司悉數到場。

這些數字背後是勢不可擋的聚合趨勢。計算能力正在推動人工智能飛躍發展，足以抵消摩爾定律的放緩步伐。人工智能開發人員加快構建新的架構，以解決我們當前最大的挑戰。他們希望能廣泛運行人工智能軟件，從功能強大的雲服務到雲端設備不一而足。

人工智能計算時代— GPU計算時代

最新架構可以利用Volta的性能顯著縮短訓練時間，提高多節點訓練性能。

深度學習是各大科技公司的戰略重點。它越來越多地滲透到基礎構架、工具、產品製造等各個方面。我們與各個架構製造商傾力合作，力求性能盡善盡美。通過優化GPU的每個架構，我們可以將訓練一個模型所需的數百次迭代縮短至數小時或數天，從而提高工程師的工作效率。Caffe2、Chainer、Microsoft Cognitive Toolkit、MXNet、PyTorch、TensorFlow等網絡都將針對Volta得到精心優化。

圍繞人工智能革命已形成一個龐大的生態系統。

性能的長足進展吸引了各個行業的創新者，過去一年，GPU驅動的人工智能服務創業公司數量增加了4倍多，達到1300家。

沒人想錯過下一個技術突破。Marc Andreessen認為，這是一個軟件為王的世界，但人工智能正在主導軟件。

在過去兩年裡，基於GitHub開放源代碼軟件庫支持領先人工智能架構的軟件開發人員已從不足5000人增至75,000多人。

由於摩爾定律日漸勢衰，從晶片到軟件一切技術進步推動的GPU計算性能呈現爆發之勢。

人工智能革命已經到來，儘管摩爾定律融合了Dennard縮放和CPU架構的領先優勢，而摩爾定律已在近十年前就開始失效。Dennard縮放通過降低晶體管尺寸和電壓，能夠使設計者在保持功率密度的同時增加晶體管密度和速度，但現在Dennard縮放遇到了元件物理的瓶頸。

CPU架構師只能獲得一定的指令級並行性（ILP），而電路和能耗卻已大幅度增加。所以在後摩爾定律時代，CPU晶體管和能耗大幅上升導致應用性能只有小幅增長。最近，其性能每年只增長10％，而過去每年的增幅為50％。

我們開創的加速計算方法針對特定的算法領域；添加專門的處理器來替代CPU；吸引各個行業的開發人員優化我們的架構，並加速自己的應用。我們致力於整個算法、求解器和應用程序棧，消除所有瓶頸，實現光速。

這就是Volta能為人工智能工作負載提供驚人加速的真正原因。它比當前NVIDIA GPU架構Pascal的性能提升了5倍，達到峰值萬億次浮點運算，優於兩年前推出的Maxwell架構15倍，遠遠超過摩爾定律的預測。

加速人工智能的各種方法

世界上最先進的人工智能計算架構Volta正式面世。

在GPU技術大會上，我們推出了Volta，這是自統一計算設備架構（CUDA）發明以來我們這個時代最大的技術飛躍。它集成了210億個晶體管，採用12nm NVIDIA優化的TSMC工藝以及三星最快的HBM內存。Volta運行全新數字格式和CUDA指令，可以超高速執行4×4矩陣運算，進行元素級深度學習。

每個Volta GPU都擁有高達120 teraflops的浮點運算能力，我們的DGX-1 AI超級計算機將八片Tesla V100 GPU連接起來，能夠實現每秒近千萬億次浮點運算的深度學習性能。

GOOGLE的TPU

同樣在上週，谷歌在其I/O會議上推出TPU2芯片，其性能可達到45 teraflops。

令人高興的是，兩個領先的人工智能團隊雖然互相競爭，但也保持全面的深入合作，例如，調整TensorFlow性能，使用NVIDIA CUDA GPU加速GOOGLE雲計算。

人工智能是人類歷史上最偉大的技術力量，所有實現人工智能大眾化並使其迅速推廣的努力都值得稱道。

發展動力源自摩爾定律失效

在GPU技術大會上推出的Isaac將強化機器人學習和模擬學習。

經過訓練後，機器人的大腦將下載到我們的人工智能超級計算機Jetson中。機器人可以承受和適應虛擬和現實世界之間的任何差異。新一代機器人誕生了。Isaac在GPU技術大會上演示瞭如何學會打冰球和高爾夫球。

最後，我們正在實現深度學習加速器（DLA）的開源化——它是NVIDIA版本的專職推理TPU，專為人工智能汽車Xavier超級芯片而打造。我們希望人工智能以最快的速度遍地開花。其他人不再需要投資開發推理式TPU，它將由我們全球最好的芯片設計師設計並免費提供。

助力當今時代的愛因斯坦和達·芬奇

以上種種只是NVIDIA GPU計算如何成為我們這個時代中愛因斯坦和達·芬奇基本工具的最新示例。對於他們來說，我們的發明不亞於一台時間機器。基於3D圖形無盡的技術需求和遊戲市場規模，NVIDIA已經將GPU發展為計算機大腦，在虛擬現實與人工智能激動人心的交匯點開啟創新的大門。

------------------------------------------

鴻鵠國際股份有限公司

1.我們協助人工智能底層設備的搭建、規劃、及交付。熟悉各類型深度學習可運行的技術設備。

2.我們交付的每一款設備，都是深度學習框架預安裝的環境，可讓使用者減少摸索時間，並且快速上手。

3.Caffe2、Chainer、Microsoft Cognitive Toolkit、MXNet、PyTorch、TensorFlow等預安裝以及優化服務。

4.我們提供python、TensorFlow、DIGITS、CUDA等初級以及進階課程。

5.我們具備數學博士級人才，協助用戶做訓練優化以及使用深度學習的直接應用。

鴻鵠國際股份有限公司

我們從事基礎人工智能技術的開發工作。所有技術，從語音識別到計算機視覺、自然語言處理、數據倉庫、用戶理解，我們用人工智能技術支持很多國際業務並孵化新業務方向。

業務窗口蔡先生

行動電話：0910-218-322

公司電話：02-2929-9388 #10

公司傳真：02-2929-7579

Email: sales1@honghutech.com

我們希望營造出一種大環境，以幫助開發人員隨時隨地在任何架構內完成工作。對於希望內部保管數據的企業，我們在GPU技術大會期間特意推出了功能強大的新型工作站和服務器。

眼下，價值2470億美元的公共雲服務市場也許最具活力。阿里巴巴、亞馬遜、百度、Facebook、谷歌、IBM、微軟和騰訊都已在各自的公有云採用了NVIDIA GPU。

為幫助創新者無縫遷移到雲服務，我們在此次GPU技術大會上推出了NVIDIA GPU Cloud雲平台，該平台包含每個架構的預配置和優化棧註冊表。每一層軟件和所有組合都已經過調整、測試和打包，並整體放入NVDocker容器內。我們將不斷加強和維護該平台，修復每一個錯誤；而現在，一切運行良好。

自動化機器的“寒武紀大爆炸”

深度學習的原始數據檢測功能為自動化機器——具有人工智能的物聯網的“寒武紀大爆炸”創造了條件。未來將有數十億，甚至數万億設備由人工智能所驅動。

我們在GPU技術大會上宣布，世界十大公司之一、備受矚目的豐田汽車公司現已與NVIDIA攜手合作開發無人駕駛汽車。

我們還推出了促進機器人製造的虛擬機器人Isaac。今天的機器人都是手動編程，只能按照編程操作。例如，卷積神經網絡為我們提供了解決無人駕駛所需的計算機視覺突破，加強學習和模擬學習可能是我們必須攻克的機器人技術難題。