2017-09-20 10:50:42 創(chuàng)事記 微博 作者: 智東西
歡迎關(guān)注“創(chuàng)事記”的微信訂閱號:sinachuangshiji
文/智東西 Lina
上周,蘋果公司在剛剛落成投入使用的“飛船”新總部(Apple Park)舉行2017年秋季新品發(fā)布會,整場發(fā)布會基本被iPhone X搶盡了風(fēng)頭(想采訪一下iPhone 8/8p的心理陰影面積)。
iPhone 8/8p和iPhone X都搭載了蘋果自研的A11 Bionic(仿生)芯片。雖然蘋果全程并沒有在這款芯片上花太多功夫介紹,但我們?nèi)耘f知道它集成了一個專用于機器學(xué)習(xí)的硬件——“神經(jīng)網(wǎng)絡(luò)引擎(Neural Engine)”
可別小看了這塊A11,通過智東西仔細(xì)研究發(fā)現(xiàn),它不僅是iPhone X中一眾“黑科技”的來源,而且蘋果為了打造這塊芯片早在9年前就開始了技術(shù)布局。
一、參數(shù)亮相,跑分爆表了
在介紹A11里專門用于機器學(xué)習(xí)的“神經(jīng)網(wǎng)絡(luò)引擎”之前,我們先來看看A11的基本參數(shù)。
工藝方面,A11采用了臺積電10nm FinFET工藝,集成了43億個晶體管(上一代采用16nm工藝的A10 Fusion集成了33億個晶體管,華為麒麟970則用10nm工藝集成了55億個)。
A11搭載了64位ARMv8-A架構(gòu)的6核CPU,其中包括2個名為“Monsoon”的性能核(performance core)和4個名為“Mistral”的能效核(high-eggiciency core),性能核比上一代A10里的快了25%,能效核則快了70%。
而且,與A10不同,A11中使用了蘋果自研的第二代新型性能控制器,允許6個CPU內(nèi)核同時使用,整體性能比上一代快了70%。
至于為什么分為性能核和能效核呢?當(dāng)手機進行發(fā)短信、瀏覽網(wǎng)頁等輕量任務(wù)時,系統(tǒng)會選擇調(diào)用能耗更低的能效核(high-eggiciency core),而當(dāng)手機需要運行對計算能力要求更高的軟件時,則需要動用性能核(performance core)進行處理,借此可以有效延長平均電池壽命。搭載了A11的iPhone X在充滿電后,將會比iPhone 7延長2個小時的待機時間。
A11的另外一大亮點就是首次搭載了蘋果自研的GPU,這是一款3核GPU,性能相比A10 Fusion提升30%,只需要一半的功耗就能達到A10的表現(xiàn)。這是今年4月蘋果宣布和英國GPU設(shè)計公司Imagination Technologies“分手”后推出的首款自研GPU,針對AR、沉浸式3D游戲等方面都進行了優(yōu)化,比A10快了30%。
A11里還集成了蘋果自研的ISP、自研的視頻編解碼器等等。從種種強調(diào)的“自研”我們不難發(fā)現(xiàn),蘋果已經(jīng)越來越強調(diào)架構(gòu)的自主化。在徹底跟老朋友Imagination Technologies分手后(并且導(dǎo)致人家股價斷崖式下跌70%后),蘋果的下一個自研目標(biāo)也許會移到基帶技術(shù)上,與高通曠日持久的專利訴訟案件算得上是前兆了。
此外,我們也可以從A11在Geekbench的跑分上一窺究竟:在Geekbench中有A11的幾個跑分,其中單核性能最高的是4274,多核性能最高的是10438,而取這些跑分平均值后,單核性能是4169,多核性能是9836。
這是什么概念呢?跟上一代A10的“單核成績3332,多核成績5558”比起來,A11在兩方面的性能有接近30%和50%的飆升。而iPad Pro中的A10X單核性能平均在3900左右,而多核性能是9200左右,依然弱于A11。
而Android陣營的種子選手——高通驍龍835的GeekBench成績?yōu)閱魏?000左右,多核6500左右。
二、A11就是“人工智能芯片”
這次,蘋果在自家的A11 Bionic芯片上搭載了一個專用于機器學(xué)習(xí)的硬件——“神經(jīng)網(wǎng)絡(luò)引擎(neural engine)”。
現(xiàn)在所謂的手機處理器,比如高通的835、蘋果的A11、麒麟970等,實際上所指的是一個“處理器包”封裝在一起,這個計算包專業(yè)一點說叫Soc(System-on-a-Chip),高大上的說法是“計算平臺”;根據(jù)分工不同,很多專用功能的處理單元加進來,比如我們最熟悉的是GPU,現(xiàn)在這個包里的獨立單元數(shù)量已經(jīng)越來越大,比如ISP(圖像處理)、Modem(通信模塊)、DSP(數(shù)字信號處理)等。
不同的數(shù)據(jù)進來,交給不同特長的計算模塊來處理將會得到更好的效果、更高的能效比,A11的神經(jīng)網(wǎng)絡(luò)引擎(neural engine)跟麒麟970的NPU一樣,是在手機處理器平臺新加入的一個擅長神經(jīng)網(wǎng)絡(luò)計算的硬件模塊。
而這也是為什么從20nm、16nm、到現(xiàn)在的10nm、以及研發(fā)中的7nm,各大芯片設(shè)計商、代工商都在拼命把芯片技術(shù)往小了做,為的就是在不影響芯片大小的前提下擠進更多的獨立處理單元。
A11的神經(jīng)網(wǎng)絡(luò)引擎采用雙核設(shè)計,每秒運算次數(shù)最高可達6000億次,相當(dāng)于0.6TFlops(寒武紀(jì)NPU則是1.92TFlops,每秒可以進行19200次浮點運算),以幫助加速人工智能任務(wù),即專門針對Face ID,Animoji和AR應(yīng)用程序的ASIC(專用集成電路/全定制AI芯片)。
有了神經(jīng)網(wǎng)絡(luò)引擎,蘋果高級副總裁Phil Schiller很有底氣的表示:
“A11 Bionic是一款智能手機到目前為止所能擁有的最強勁、最智能的芯片。而基于ASIC的深度學(xué)習(xí),實現(xiàn)了高準(zhǔn)確率之外,還能比基于通用芯片(GPU、FPGA)的方案減少功耗。”
不過,蘋果對這款神經(jīng)網(wǎng)絡(luò)引擎的功耗、實測性能等方面都沒有進一步披露。
A11同時也支持Core ML,這是蘋果在今年WWDC開發(fā)者大會上推出的一款新型機器學(xué)習(xí)框架,能讓開發(fā)者更方便地將機器學(xué)習(xí)技術(shù)整合到自己的App中。Core ML支持所有主要的神經(jīng)網(wǎng)絡(luò),如DNN、RNN、CNN等,開發(fā)者可以把訓(xùn)練完成的機器學(xué)習(xí)模型封裝進App之中。
三、買買買,買出來的AI帝國
從去2010年開始,蘋果就沒有停止過收購人工智能創(chuàng)企的步伐,并且每次給出的都是慣常聲明:“蘋果會不時收購規(guī)模較小的科技公司。我們通常不討論目的或計劃!狈浅S小笆铝朔饕氯,深藏功與名”的意思。
而且,每個被蘋果收購的公司都會立即關(guān)閉對外的產(chǎn)品和服務(wù),像是忽然從世界消失一般。
收購芯片廠商
以芯片為例,早在2008年,蘋果就以2.78億美元收購了2003年成立加州的高性能低功耗處理器制造商PA Semi。
隨后在2010年,蘋果以1.21億美元收購了1997年成立的美國德州半導(dǎo)體邏輯設(shè)計公司Intrinsity,專注于設(shè)計較少晶體管、低能耗同時具備高性能的處理器。
2011年年底,蘋果又以3900萬美元的價格收購了以色列閃存控制器設(shè)計公司Anobit。
2013年8月1日,蘋果收購了成立于2007年的加州半導(dǎo)體公司Passif Semiconductor,其專長于低功耗無線通訊芯片(大膽地猜測一下Apple Watch的芯片技術(shù)是不是來自這里)。
其后的2015年底,蘋果再次斥資1820萬美元,收購了一間位于加州圣何塞北部的面積7萬平方英尺(6500平方米)的芯片制造工廠。這座工廠原屬于芯片制造商Maxim Integrated Products,其設(shè)施包括了芯片制造工具,而且工廠地址靠近三星半導(dǎo)體公司。
從以上一連串的買買買我們可以看到,蘋果的芯片布局早在近十年前就開始了。
除了芯片之外,從2010年至今,蘋果已經(jīng)陸續(xù)收購了四五十家創(chuàng)企,包括語音識別、圖像/面部識別、計算機視覺、AR、數(shù)據(jù)挖掘、機器學(xué)習(xí)、地圖、定位等等,而這其中幾個比較具備代表性的有:
收購面部識別/表情追蹤廠商——Animoji和Face ID的技術(shù)來源
2010年,蘋果以2900萬美元收購瑞典面部識別創(chuàng)企Polar Rose,他們開發(fā)的面部識別程序可以可以為用戶自動圈出照片中的人臉。
2015年11月,蘋果收購《星球大戰(zhàn)》背后的動作捕捉技術(shù)公司Faceshift,這家蘇黎世的創(chuàng)業(yè)公司開發(fā)了實時追蹤人臉表情,然后再用動畫表現(xiàn)出來的技術(shù)。該技術(shù)還可以實現(xiàn)面部識別。
2016年1月,蘋果收購了加州AI初創(chuàng)Emollient,該公司使用人工智能技術(shù)讀取圖片中的面部表情。
2017年2月,蘋果以200萬美元收購了面部識別以色列創(chuàng)企RealFace,該公司開發(fā)了一種獨特的面部識別技術(shù),其中整合人工智能并將人類的感知帶回數(shù)字過程。
收購AR引擎巨頭
2015年5月,蘋果收購AR引擎巨頭德國Metaio公司。彼時Metaio與Vuforia并肩稱霸AR引擎行業(yè),Metaio擁有約15萬名開發(fā)者,Vuforia則擁有大約18萬,兩家的SDK開發(fā)者占到了當(dāng)時整個市場的95%以上,在AR的行業(yè)地位有如Windows和Mac OS之于PC。這個收購舉措,可以看作是ARkit的技術(shù)來源。
收購25年德國老牌眼球追蹤企業(yè)
而離現(xiàn)在最近的一次收購,就是蘋果今年6月時宣布收購德國老牌眼動追蹤企業(yè)SMI(SensoMotoric Instruments)。其歷史要追溯到1991年,SMI從柏林自由大學(xué)學(xué)術(shù)醫(yī)療研究院剝離出來,獨自成立眼球追蹤技術(shù)公司,迄今已經(jīng)有超過25年的發(fā)展歷史了。產(chǎn)品包括面向企業(yè)與研發(fā)機構(gòu)的眼球追蹤設(shè)備/應(yīng)用、醫(yī)療醫(yī)療眼控輔助設(shè)備、手機、電腦、VR設(shè)備等的眼控技術(shù)支持等。
目前,眼球追蹤技術(shù)已經(jīng)被集成在了iPhone X里。在用Face ID解鎖時,只要你眼睛沒有看著屏幕,屏幕也是不會解鎖的。
四、用來干啥:Face ID背后的結(jié)構(gòu)光學(xué)技術(shù)
既然是“人工智能芯片”,當(dāng)然是用來做人工智能——人臉識別、圖像識別、面部表情追蹤、語音識別、NLP、SLAM等等。
而A11的神經(jīng)網(wǎng)絡(luò)引擎第一個重要的應(yīng)用就是iPhone X的刷臉解鎖——Face ID。
雖然刷臉解鎖并不是什么石破天驚的新技術(shù),但是蘋果的Face ID解鎖跟普通的基于RGB圖像的人臉識別解鎖不同。寒武紀(jì)架構(gòu)研發(fā)總監(jiān)劉少禮博士說:
“我們這次對蘋果A11的AI引擎了解不多,特別是功耗、實測性能等方面蘋果發(fā)布會基本沒有提。個人覺得iPhone X這次最大的亮點是距離傳感器,用來支持3D的Face ID,這個功能在業(yè)內(nèi)還是引起了不小震動,后續(xù)會給予這功能開發(fā)出不少有趣的應(yīng)用。通過結(jié)構(gòu)光發(fā)射器和紅外攝像頭配合,可以捕捉人臉的深度信息,比之前用2D圖像作人臉識別進步了很多。”
根據(jù)原理和硬件實現(xiàn)方式的不同,行業(yè)內(nèi)所采用的3D機器視覺主要有三種:結(jié)構(gòu)光、TOF 時間光、雙目立體成像。
三種主流的 3D 視覺方案代表性產(chǎn)品
雙目立體成像方案軟件算法復(fù)雜,技術(shù)還不成熟;結(jié)構(gòu)光方案技術(shù)成熟,功耗低,平面信息分辨率高,但是容易受光照影響,識別距離近;TOF 方案抗干擾性好,識別距離遠,但是平面分辨率低,功耗較大。
綜合來看,結(jié)構(gòu)光方案更加適合消費電子產(chǎn)品前置近距離攝像,可應(yīng)用于人臉識別 、手勢識別等方面,TOF方案更加適合消費電子產(chǎn)品后置遠距離攝像,可應(yīng)用于 AR、體感交互等方面。
iPhone X的Face ID采用了人工智能加持的結(jié)構(gòu)光方案:數(shù)據(jù)采集由該機正面上方的景深感知攝像機(即“劉海兒”,TrueDepth Camera System)完成,其紅外線發(fā)射器可以發(fā)射3萬個偵測點,利用神經(jīng)引擎(Neural Engine)將反射回來的數(shù)據(jù)與儲存在A11芯片隔區(qū)內(nèi)的數(shù)據(jù)進行對比,實現(xiàn)用戶面部的3D讀取與處理。通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練的加持,F(xiàn)ace ID失誤率僅為百萬分之一,遠小于Touch ID的五萬分之一。
與此同時,iPhone X還具備眼球追蹤功能,在你面對屏幕,但是眼睛沒有看著它的時候,也是不會解鎖的。所以,這樣的人臉解鎖是照片騙不了的。
而且,蘋果的軟件工程高級副總裁Craig Federighi曾表示,“我們不會在用戶注冊Face ID時收集數(shù)據(jù),它會保留在你的設(shè)備上,不會被發(fā)送到云端進行訓(xùn)練! 符合蘋果一貫的“用戶隱私為上”理念。
最為神奇的是,用戶面容適應(yīng)(化妝、佩戴眼鏡、長胡子、隨著年齡增長而變?nèi)莞淖兊龋┻^程需要用到的深度學(xué)習(xí)訓(xùn)練也是在本地完成的。深度學(xué)習(xí)分為訓(xùn)練(Training)和推理/應(yīng)用(Inference)兩部分,訓(xùn)練階段所需的計算量比應(yīng)用階段的要大上許多。
另一方面,計算與訓(xùn)練的本地化也有助于讓Siri變得更加智能。畢竟有不少人認(rèn)為由于蘋果對用戶的隱私過于重視,導(dǎo)致Siri發(fā)展較慢,競爭對手們后來居上。
此外,在A11的加成下,iPhone X前頭“劉海兒”實現(xiàn)的臉部追蹤技術(shù)還可以用于個人定制化表情Animoji(能捕捉并分析 50 多種不同的肌肉運動)、AR濾鏡等,新的互動的方式有望提高用戶的參與度和粘性,提高AR社交平臺的經(jīng)濟價值。而3D視覺所提供的景深信息和建模能力是現(xiàn)有普通攝像頭無法比擬的。
而iPhone X還搭載了全新陀螺儀和加速計,刷新率達到60 fps,可以實現(xiàn)準(zhǔn)確的動作追蹤以及很好的渲染效果。在發(fā)布會上,蘋果全球市場營銷高級副總裁Phil Schiller是這么說的:“這是第一款真正為AR打造的智能手機。”
五、火熱的AI芯片產(chǎn)業(yè)
當(dāng)前人工智能芯片主要分為GPU、ASIC、FPGA。代表分別為NVIDIA Tesla系列GPU、Google的TPU、Xilinx的FPGA。此外,Intel還推出了融核芯片Xeon Phi,適用于包括深度學(xué)習(xí)在內(nèi)的高性能計算,但目前根據(jù)公開消息來看在深度學(xué)習(xí)方面業(yè)內(nèi)較少使用。
其中,蘋果的A11、寒武紀(jì)的A1、谷歌的TPU等都屬于ASIC,也就是專用集成電路。
ASIC(Application Specific Integrated Circuit)。顧名思義,ASIC就是根據(jù)特定的需求而專門設(shè)計并制造出的芯片,能夠優(yōu)化芯片架構(gòu),針對性的提出神經(jīng)網(wǎng)絡(luò)計算處理的指令集,因而在處理特定任務(wù)時,其性能、功耗等方面的表現(xiàn)優(yōu)于 CPU、GPU 和 FPGA;但ASIC算法框架尚未統(tǒng)一,因此并未成為目前主流的解決方案。
寒武紀(jì)1號神經(jīng)網(wǎng)絡(luò)處理器架構(gòu)
谷歌ASIC產(chǎn)品探索
現(xiàn)有的ASIC包括谷歌的TPU、我國中科院計算所的寒武紀(jì)、應(yīng)用于大疆無人機和海康威視智能攝像頭的Movidius Myriad芯片、曾用于Tesla汽車自動駕駛和ADAS的Mobileye芯片等針對特定算法以及特定框架的全定制AI芯片。
此外,更近一步的的AI芯片前景,大概是IBM的TrueNorth這類的類腦芯片(BPU)。類腦芯片的目的是開發(fā)出新的類腦計算機體系結(jié)構(gòu),會采用憶阻器和 ReRAM 等新器件來提高存儲密度,目前技術(shù)遠未成熟。
不同芯片在人工智能計算方面各有所強
結(jié)語:我們離手機AI芯片還有多遠?
在蘋果的推動下,專用AI處理單元可能會越來越成為智能手機芯片的發(fā)展趨勢。畢竟目前在生物識別、圖形圖像識別、用戶使用習(xí)慣學(xué)習(xí)等方面都越來越依賴機器學(xué)習(xí)技術(shù),而不太穩(wěn)定的網(wǎng)絡(luò)帶寬(大家記不記得早期Prisma要等好久才能生成圖片)、個人隱私、功耗比等問題也在驅(qū)動著手機芯片集成專用AI處理單元的發(fā)展。
總的來說,無論是A11還是之前的麒麟970,都是讓AI在手機端開始由軟到硬落地的表現(xiàn),是人工智能進一步產(chǎn)業(yè)化落地的一個典型代表。