人們越來越看好人工智能的前景及其潛在的爆發(fā)力,而能否發(fā)展出具有超高運算能力且符合市場的芯片成為人工智能平臺的關(guān)鍵一役。由此,2016年成為芯片企業(yè)和互聯(lián)網(wǎng)巨頭們在芯片領(lǐng)域全面展開部署的一年。而在這其中,英偉達保持著絕對的領(lǐng)先地位。但隨著包括谷歌、臉書、微軟、亞馬遜以及百度在內(nèi)的巨頭相繼加入決戰(zhàn),人工智能領(lǐng)域未來的格局如何,仍然待解。
在2016年,所有人都看到了人工智能的前景和其潛在的爆發(fā)力,但不管是AlphaGo還是自動駕駛汽車,要想使得任何精妙算法得以實現(xiàn),其基礎(chǔ)是硬件的運算能力:也就是說,能否發(fā)展出超高運算能力又符合市場需求的芯片成為了人工智能平臺的關(guān)鍵一役。
因此,毫無疑問,2016年也成為了芯片企業(yè)和互聯(lián)網(wǎng)巨頭們在芯片領(lǐng)域全面展開部署的一年:先有CPU芯片巨頭因特爾年內(nèi)三次大手筆收購人工智能和GPU領(lǐng)域企業(yè);后有谷歌宣布開發(fā)自己的處理系統(tǒng),而蘋果、微軟、臉書和亞馬遜也都紛紛加入。
而在這其中,領(lǐng)跑者英偉達(Nvidia)因其在人工智能領(lǐng)域的優(yōu)勢使其成為了資本市場的絕對寵兒:在過去的一年中,曾經(jīng)以游戲芯片見長的Nvidia股價從十幾年的穩(wěn)居30美元迅速飆升至120美元。
就當資本市場都在猶豫是否人工智能風口使得英偉達股價虛高時,2月10日,英偉達發(fā)布2016年第四季度的財報顯示,其營收同比增長55%,凈利潤達到了6.55億美元,同比增長216%。
“正當Intel、微軟等巨頭投資人工智能為基礎(chǔ)的芯片技術(shù)時,英偉達已經(jīng)以Q4財報顯示,這家已經(jīng)在人工智能領(lǐng)域投資將近12年的芯片企業(yè)已經(jīng)開始就此收獲可觀的盈利!辟Y深技術(shù)評論家Therese Poletti在其財報發(fā)布后指出。
研究機構(gòu)Tractica LLC估計,由于深度學習項目產(chǎn)生的硬件花費將從2015年的4360萬美元,上升到2024年的41億美元,而企業(yè)的相關(guān)軟件花費將同期從1.09億美元上升到100億美元。
正是這一龐大的市場吸引著谷歌、臉書、微軟、亞馬遜以及百度在內(nèi)的巨頭相繼宣布企業(yè)向人工智能領(lǐng)域的技術(shù)轉(zhuǎn)向!霸谌斯ぶ悄芟嚓P(guān)技術(shù)上,目前英偉達仍然保持著絕對的領(lǐng)先,但隨著包括谷歌在內(nèi)的TPU等技術(shù)不斷推向市場,未來的AI硬件格局仍然待解!币晃徊槐憔呙臍W洲資深從業(yè)人員向21世紀經(jīng)濟報道表示。
英偉達在GPU領(lǐng)域顯著領(lǐng)先
根據(jù)英偉達最新公布的年報,其最主要的業(yè)務領(lǐng)域均出現(xiàn)了兩位數(shù)以上的增長。除了其一直占有領(lǐng)先優(yōu)勢的游戲業(yè)務增長之外,其更多的漲幅事實上來自于數(shù)據(jù)中心業(yè)務和自動駕駛兩大全新業(yè)務板塊。
年報數(shù)據(jù)顯示,數(shù)據(jù)中心業(yè)務有138%的增長,而自動駕駛有52%的增長。
“事實上,這是整個英偉達財報里最具有說明力的內(nèi)容,因為數(shù)據(jù)業(yè)務和自動駕駛的增長根本上是人工智能和深度學習的發(fā)展所激發(fā)的。”一位美國計算機硬件分析師向21世紀經(jīng)濟報道表示。
在目前的深度學習領(lǐng)域,把神經(jīng)網(wǎng)絡投入實際應用要經(jīng)歷兩個階段:首先是訓練,其次是執(zhí)行。從目前的環(huán)境來看,訓練階段非常需要處理大量數(shù)據(jù)的GPU(圖形處理器,下同),也就是以游戲和高度圖形化的應用做圖像渲染起家的英偉達領(lǐng)先的領(lǐng)域;而在轉(zhuǎn)型階段則需要處理復雜程序的CPU,也就是微軟十幾年來領(lǐng)先的領(lǐng)域。
“英偉達目前的成功事實上代表了GPU的成功,它正是最早的GPU領(lǐng)先者之一!鄙鲜鲂袠I(yè)分析師表示。
深度學習神經(jīng)網(wǎng)絡尤其是幾百上千層的神經(jīng)網(wǎng)絡,對高性能計算需求非常高,而GPU對處理復雜運算擁有天然的優(yōu)勢:它有出色的并行矩陣計算能力,對于神經(jīng)網(wǎng)絡的訓練和分類都可以提供顯著的加速效果。
舉個例子,研究員不用一開始就人工定義一個人臉,而是可以將幾百萬個人臉的圖像展示出來,讓計算機自己定義人臉應該是什么樣子的。學習這樣的例子時,GPU可以比傳統(tǒng)處理器更加快速,大大加快了訓練過程。
因此,搭載GPU的超級計算機已經(jīng)成為訓練各種深度神經(jīng)網(wǎng)絡的不二選擇,比如Google大腦早期就是使用Nvidia的GPU做深度學習!拔覀冋诖罱ㄒ豢顜в懈櫣δ艿臄z像裝置,因此需要找到最適合的芯片,GPU是我們的首選。”歐盟AR初創(chuàng)企業(yè)Quine CEO Gunleik Groven在今年一月的CES(國際消費電子展)現(xiàn)場向本報記者表示。
目前,谷歌、Facebook、微軟、Twitter和百度等互聯(lián)網(wǎng)巨頭,都在使用這種叫做GPU的芯片,讓服務器學習海量的照片、視頻、聲音文檔,以及社交媒體上的信息,來改善搜索和自動化照片標記等各種各樣的軟件功能。一些汽車制造商也在利用這項技術(shù),開發(fā)可以感知周圍環(huán)境、避開危險區(qū)域的無人駕駛汽車。
除了在GPU和圖形計算領(lǐng)域長期領(lǐng)先,英偉達也是最早一批在人工智能領(lǐng)域進行投資的科技公司。2008年,當時在斯坦福做研究的吳恩達發(fā)表了一篇用GPU上的CUDA進行神經(jīng)網(wǎng)絡訓練的論文。2012年“深度學習三巨頭”之一Geoff Hilton的學生Alex Krizhevsky用英偉達的GeForce顯卡在ImageNet中將圖像識別準確率大幅提升,這也是英偉達CEO黃仁勛時常提到的英偉達注重深度學習的開端。
有報告顯示,世界上目前約有3000多家AI初創(chuàng)公司,大部分都采用了Nvidia提供的硬件平臺。
“深度學習被證明是非常有效的!秉S仁勛在季報2月10日的發(fā)布會中表示。在列舉目前GPU計算平臺正在人工智能、云計算、游戲和自動駕駛領(lǐng)域快速展開應用的同時,黃仁勛表示,在未來數(shù)年間,深度學習將會成為計算機計算的一種基礎(chǔ)性的核心工具。
AMD和Intel巨頭的AI演變
投資者和芯片制造商關(guān)注著所有互聯(lián)網(wǎng)巨頭的一舉一動。僅僅以英偉達的數(shù)據(jù)中心業(yè)務為例,在很長一段時間以來,該公司一直為谷歌提供數(shù)據(jù)服務。
英偉達并非GPU的唯一領(lǐng)先者,巨頭Intel和AMD都在這一領(lǐng)域有著不同的優(yōu)勢。
2016年11月,Intel公司發(fā)布了一個叫做Nervana的AI處理器,他們宣稱會在明年年中測試這個原型。如果一切進展順利,Nervana芯片的最終形態(tài)會在2017年底面世。這個芯片名稱基于Intel早前購買的一個叫做Nervana的公司。按照Intel的人所說,這家公司是世界上第一家專門為AI打造芯片的公司。
Intel公司披露了一些關(guān)于這個芯片的一些細節(jié),按照他們所說,這個項目代碼為“Lake Crest”,將會用到Nervana Engine 和Neon DNN相關(guān)軟件。這款芯片可以加速各類神經(jīng)網(wǎng)絡,例如谷歌TensorFlow框架。
芯片由所謂的“處理集群”陣列構(gòu)成,處理被稱作“活動點”的簡化數(shù)學運算。相對于浮點運算,這種方法所需的數(shù)據(jù)量更少,因此帶來了10倍的性能提升。
Lake Crest利用私有的數(shù)據(jù)連接創(chuàng)造了規(guī)模更大、速度更快的集群,其拓撲結(jié)構(gòu)為圓環(huán)形或其他形式。這幫助用戶創(chuàng)造更大、更多元化的神經(jīng)網(wǎng)絡模型。這一數(shù)據(jù)連接中包含12個100Gbps的雙向連接,其物理層基于28G的串并轉(zhuǎn)換。
TPU與FPGA可能的逆襲
在上述芯片巨頭進行GPU領(lǐng)域的提升之外,有更多的企業(yè)在試圖引發(fā)一輪全面的顛覆。其代表為谷歌在2016年宣布將獨立開發(fā)一種名為TPU的全新的處理系統(tǒng)。
TPU是專門為機器學習應用而設計的專用芯片。通過降低芯片的計算精度,減少實現(xiàn)每個計算操作所需的晶體管數(shù)量,從而能讓芯片的每秒運行的操作個數(shù)更高,這樣經(jīng)過精細調(diào)優(yōu)的機器學習模型就能在芯片上運行得更快,進而更快地讓用戶得到更智能的結(jié)果。Google將TPU加速器芯片嵌入電路板中,利用已有的硬盤PCI-E接口接入數(shù)據(jù)中心服務器中。
據(jù)Google 資深副總裁Urs Holzle 透露,當前Google TPU、GPU 并用,這種情況仍會維持一段時間,但他表示,GPU 可執(zhí)行繪圖運算工作,用途多元;TPU 屬于ASIC,也就是專為特定用途設計的特殊規(guī)格邏輯IC,由于只執(zhí)行單一工作,速度更快,但缺點是成本較高。
除了上述提到的谷歌,微軟也在使用一種叫做現(xiàn)場可變編程門陣列(FPGA)的新型處理器。
據(jù)介紹,這個FPGA 目前已支持微軟Bing,未來它們將會驅(qū)動基于深度神經(jīng)網(wǎng)絡——以人類大腦結(jié)構(gòu)為基礎(chǔ)建模的人工智能——的新搜索算法,在執(zhí)行這個人工智能的幾個命令時,速度比普通芯片快上幾個數(shù)量級。有了它,你的計算機屏幕只會空屏23毫秒而不是4秒。
在第三代原型中,芯片位于每個服務器的邊緣,直接插入到網(wǎng)絡,但仍舊創(chuàng)造任何機器都可接入的FPGA池。這開始看起來是Office 365可用的東西了。最終,Project Catapult準備好上線了。另外,Catapult硬件的成本只占了服務器中所有其它的配件總成本的30%,需要的運轉(zhuǎn)能量也只有不到10%,但其處理速度卻是原來的2倍。
此外,有一些公司,例如Nervada和Movidius,模擬GPU的平行模式,但是專注于更快速地移動數(shù)據(jù),省略圖像所需要的功能。其他公司,包括使用了被稱為“True North”的芯片的IBM公司,開發(fā)了由神經(jīng)元、突觸等其他大腦特征所啟發(fā)的芯片設計。
由于深度學習和人工智能未來的巨大前景,各大巨頭都在盡量爭取技術(shù)上的優(yōu)勢。如果這其中的某家公司,如谷歌,用一種新型芯片替換掉現(xiàn)有芯片,這基本上就相當于顛覆了整個芯片行業(yè)。
“不管是英偉達、Intel還是谷歌或是百度,都在尋找一種未來人工智能能夠廣泛應用的基礎(chǔ)!盩herese Poletti表示。
而也有很多人持有與谷歌副總裁Urs Holzle 同樣的觀點,認為在人工智能的遙遠未來,GPU沒有代替CPU,而TPU也不會取代GPU,芯片市場將出現(xiàn)更大的需求和繁榮。