平頭哥出道一年了
副題:
作者: 王海 李娜
[ 換言之,對于中小AI芯片廠商來說,也許芯片行業(yè)的“血雨腥風(fēng)”才只是個開始,特別是在云計(jì)算領(lǐng)域,這是一場涉及資本與人才的全球化較量,F(xiàn)在來看,這場豪賭只屬于大玩家。 ]
2018年云棲大會期間,阿里巴巴宣布成立一家獨(dú)立運(yùn)營的芯片公司——“平頭哥半導(dǎo)體有限公司”。一年過去,阿里的芯片戰(zhàn)略進(jìn)展如何?
9月25日,阿里巴巴集團(tuán)首席技術(shù)官兼阿里云智能總裁張建鋒發(fā)布了阿里的首款A(yù)I芯片含光800,該芯片是一款云端AI芯片,屬于AI推理芯片。含光800主要應(yīng)用于視覺場景,已經(jīng)在阿里巴巴集團(tuán)內(nèi)多個場景大規(guī)模應(yīng)用,其他企業(yè)可以通過阿里云獲得含光NPU的算力。
張建鋒表示,平頭哥用大概一年半的時間實(shí)現(xiàn)了含光800從設(shè)計(jì)到商用。
依托阿里資源
作為一個長周期的行業(yè),要想加速芯片的商用,在硬件和軟件方面都需要有很強(qiáng)的實(shí)力,特別是在AI時代,軟硬一體化的重要性更加突顯。
芯片廠商面臨著技術(shù)路徑的選擇:CPU雖然能解決單次復(fù)雜問題,但無法支撐深度學(xué)習(xí)的大規(guī)模并行計(jì)算需求。GPU最初隨著圖像處理需求出現(xiàn),處理大量數(shù)據(jù)并行運(yùn)算、浮點(diǎn)運(yùn)算的能力迎合了深度學(xué)習(xí)的需求,相比CPU處理速度更快、功耗更低,因此被最先引入深度學(xué)習(xí)。FPGA可以通過FPGA配置文件來定義這些門電路及存儲器間的連線,從而實(shí)現(xiàn)特定的功能,并且可以通過配置特定的文件將FPGA轉(zhuǎn)變?yōu)椴煌奶幚砥。雖然有可以多次更改的優(yōu)勢,但是在AI芯片的進(jìn)展上不算快。ASIC則是為了特定應(yīng)用而設(shè)計(jì)的集成電路,除了不能擴(kuò)展以外,在功耗、可靠性、體積方面都有優(yōu)勢,在云端和終端上擠滿了一眾蓄勢待發(fā)的AI廠商。
相比之下,含光800性能突破得益于軟硬件的協(xié)同創(chuàng)新,芯片架構(gòu)方面,含光800采用創(chuàng)新的架構(gòu),針對深度學(xué)習(xí)中使用的大量權(quán)重參數(shù)和張量數(shù)據(jù),在支持稀疏壓縮與量化處理的基礎(chǔ)上,通過獨(dú)特設(shè)計(jì)的數(shù)據(jù)訪存與流水線處理技術(shù),大大減低了I/O需求和數(shù)據(jù)的搬移。NPU同時深度優(yōu)化了卷積、向量計(jì)算和各種激活函數(shù),通過更有效的硬件資源調(diào)度和全并行的數(shù)據(jù)流處理,提升了AI運(yùn)算的性能和能效。
平頭哥借力于阿里在軟硬件方面的積累。算法方面,阿里巴巴達(dá)摩院機(jī)器智能實(shí)驗(yàn)室過去兩年構(gòu)建了完整的算法體系,涵蓋語音智能、語言技術(shù)、機(jī)器視覺、決策智能等方向,并且取得多個世界領(lǐng)先水平的成果;硬件方面,阿里巴巴此前已在服務(wù)器、FPGA以及存儲等領(lǐng)域擁有多年研發(fā)經(jīng)驗(yàn),此外,平頭哥團(tuán)隊(duì)在體系結(jié)構(gòu)、編譯技術(shù)等領(lǐng)域擁有深厚的技術(shù)儲備。
其中,性能的提升必須解決內(nèi)存墻問題。所謂的內(nèi)存墻,是指采用馮諾依曼結(jié)構(gòu)的處理器,存儲和運(yùn)算處理分離,當(dāng)進(jìn)行深度神經(jīng)網(wǎng)絡(luò)處理時,算力得到了提升,但大量讀寫運(yùn)行操作會受到帶寬限制,芯片的整體性能提升也同時受到限制。
平頭哥的做法是通過自研架構(gòu)大幅減少對內(nèi)存的訪問,在保證性能的情況下,把芯片功耗降到最低水平。具體而言,含光800會根據(jù)神經(jīng)網(wǎng)絡(luò)推理運(yùn)算特征,設(shè)計(jì)特定的硬件、高速連接的存儲結(jié)構(gòu)以及專用指令集,對內(nèi)存和計(jì)算單元實(shí)現(xiàn)高效組織管理,實(shí)現(xiàn)單條指令完成多個操作,提高計(jì)算效率和內(nèi)存訪問效率。
目前,含光800已應(yīng)用于阿里巴巴集團(tuán)內(nèi)多個場景,例如視頻圖像識別/分類/搜索、城市大腦等,未來還可應(yīng)用于醫(yī)療影像、自動駕駛等領(lǐng)域。
比如,拍立淘是手機(jī)淘寶上用圖片搜索商品的一個功能,拍立淘商品庫每天新增10億商品圖片,為了讓用戶快速從海量圖片中精準(zhǔn)搜索到商品,需要強(qiáng)大的計(jì)算力支撐,使用含光800搜索效率可提升12倍,時間從傳統(tǒng)通用GPU的1小時縮減至5分鐘。
“含光800芯片的設(shè)計(jì)、封裝、測試等環(huán)節(jié)已完成,流片一次通過,現(xiàn)在在跟業(yè)務(wù)方做適配、驗(yàn)證的過程,預(yù)計(jì)今年年底可以完成主要業(yè)務(wù)方適配、驗(yàn)證的過程。”9月25日,阿里巴巴平頭哥半導(dǎo)體公司研究員驕旸告訴第一財(cái)經(jīng)記者,雖然取得了一些成績,但要達(dá)到英偉達(dá)的水平還有一段很長的路要走。
含光800是一款云端AI芯片,后續(xù)會做PC、手機(jī)端上的芯片,用IP的形式去賦能客戶!跋仍谠贫俗龃笮酒、技術(shù)上占領(lǐng)制高點(diǎn),如果在云上做成了之后,客戶對于公司在PC、手機(jī)等端上也會充滿信心。”驕旸表示。
阿里官方表示,成立僅一年的芯片公司平頭哥僅用7個月時間完成了前端設(shè)計(jì),之后用3個月成功流片!昂徒^大多數(shù)芯片商不同的是,平頭哥的目的并非賣芯片,含光800將通過阿里云對外輸出AI算力,未來企業(yè)可以通過阿里云獲取含光800的算力!
另外,平頭哥還將成立芯片開放社區(qū),為芯片產(chǎn)業(yè)提供開放協(xié)作平臺。北京清微智能科技有限公司首席科學(xué)家尹首一告訴第一財(cái)經(jīng)記者,這能夠給終端設(shè)備提供更高算力,在與平頭哥無劍芯片合作的過程中,平頭哥能夠在系統(tǒng)模塊、架構(gòu)等方面有一個很深的優(yōu)化!耙?yàn)橛辛似筋^哥這樣的平臺技術(shù),可以使得我們產(chǎn)品迭代的速度更快,更具競爭力!
芯片投資成“重資產(chǎn)”游戲
根據(jù)高盛的統(tǒng)計(jì),2017云計(jì)算的市場滲透率達(dá)到了8%,2021年滲透率將增長至15%。未來它將成為IT市場的主導(dǎo)。
在過去10多年里,云計(jì)算改變了IT產(chǎn)品的產(chǎn)權(quán)歸屬,從客戶端轉(zhuǎn)移到云廠商。在這個轉(zhuǎn)變的過程中,整個產(chǎn)業(yè)鏈的核心環(huán)節(jié)還算穩(wěn)定,依舊是英特爾、AMD、英偉達(dá)等廠商提供芯片,聯(lián)想、戴爾、浪潮等廠商組裝服務(wù)器,然后賣給AWS、阿里云等這樣的云計(jì)算廠商,由云廠商以服務(wù)和按需消費(fèi)的方式提供給最終客戶。
不過過去兩年間,隨著人工智能的興起,市場的風(fēng)向有了變化。
從行業(yè)看,經(jīng)過數(shù)十年的快速迭代發(fā)展,高速的摩爾定律已經(jīng)難以實(shí)現(xiàn)。
過去5年,通用CPU的發(fā)展遇到了許多技術(shù)瓶頸,單核性能平均每年提升不足10%。想要進(jìn)一步實(shí)現(xiàn)提高技術(shù)能力,在晶體管上打主意太難,需要尋找其他路徑。同時,目前在先進(jìn)的大規(guī)模數(shù)據(jù)中心中,服務(wù)器成本占比持續(xù)提升。以目前華為云數(shù)據(jù)中心為例,服務(wù)器成本占比已超過60%,計(jì)算正在成為數(shù)據(jù)中心的主體。也就是說,如果華為購買其他市場上的板卡,再來提供云服務(wù),不虧都很難達(dá)到。
行業(yè)的共識是,未來云計(jì)算一定成為全社會的基礎(chǔ)設(shè)施或者公共服務(wù),這時就需要云計(jì)算服務(wù)做到有規(guī)模,成本低,并且使用便利。
這幾年,在云計(jì)算上排名靠前的頭部廠商紛紛開始投入芯片領(lǐng)域,尤其是AI芯片,谷歌、阿里巴巴、亞馬遜AWS等云廠商都在開發(fā)用于機(jī)器學(xué)習(xí)等應(yīng)用場景的芯片技術(shù)。不同的技術(shù)路徑“亂花漸欲迷人眼”。
有不愿意透露姓名的分析師質(zhì)疑,“含光公布的指標(biāo)是IPS,一改以往算flops的習(xí)慣,P4也是幾年前的產(chǎn)品了,AI產(chǎn)品對標(biāo)的標(biāo)的有些討巧。”
但他也坦言,半導(dǎo)體需要巨頭不斷投入,有泡沫才有機(jī)會,才有更多的人才愿意加入。雖然與英偉達(dá)、英特爾這些芯片廠商相比,云服務(wù)廠商的AI芯片計(jì)劃仍處于相對初級階段。但芯片主要是自用,為自家的AI應(yīng)用量身打造,也將更加符合自身產(chǎn)品的特性。
此前,華為云總裁鄭葉來對記者表示,公有云未來的集中度會越來越高,以后不僅僅是玩資本的游戲,更是一個研發(fā)投資的游戲!白鯞端的生意,它一定不可能去掙快錢的。未來公有云不是長板戰(zhàn)略,說我有一個東西特別厲害。別人學(xué)你,不會的。未來的云服務(wù)一定是短板戰(zhàn)略,哪個不行就沒人學(xué)你?蛻糍I的是一個服務(wù)。云服務(wù)首先是短板戰(zhàn)略,你哪個東西不行你就麻煩了!
換言之,對于中小AI芯片廠商來說,也許芯片行業(yè)的“血雨腥風(fēng)”才只是個開始,特別是在云計(jì)算領(lǐng)域,這是一場涉及資本與人才的全球化較量,F(xiàn)在來看,這場豪賭只屬于大玩家。