MSCBSC 移動通信論壇
搜索
登錄注冊
網(wǎng)絡(luò)優(yōu)化工程師招聘專欄 4G/LTE通信工程師最新職位列表 通信實習(xí)生/應(yīng)屆生招聘職位

  • 閱讀:437
  • 回復(fù):0
揭秘華為麒麟 970:性能升級是其次人工智能才是絕招
mao_mao
論壇副管
鎵嬫満鍙風(fēng)爜宸查獙璇? style=


 發(fā)短消息    關(guān)注Ta 

C友·鐵桿勛章   管理·勤奮勛章   C友·進步勛章   管理·優(yōu)秀勛章   C友·貢獻勛章   “灌水之王”   紀念勛章·七周年   管理·標(biāo)兵勛章   活動·積極勛章   財富勛章·財運連連   財富勛章·大富豪   財富勛章·小財主   專家·終級勛章   財富勛章·神秘富豪   C友·登錄達人   紀念勛章·五周年   財富勛章·富可敵國   財富勛章·財神   財富勛章·富甲一方   財富勛章·鉆石王老五   活動·第二屆通信技術(shù)杯   紀念勛章·六周年   活動·攝影達人   紀念勛章·八周年   紀念勛章·九周年   紀念勛章·十周年   C友·技術(shù)大神  
積分 428896
帖子 85070
威望 5512371 個
禮品券 5423 個
專家指數(shù) 3546
注冊 2009-4-24
專業(yè)方向  移動通信
回答問題數(shù) 0
回答被采納數(shù) 0
回答采納率 0%
 
發(fā)表于 2017-09-04 16:34:42  只看樓主 

  北京時間 9 月 2 日晚上,華為消費者業(yè)務(wù) CEO 余承東在德國的 IFA 電子展的官方論壇上做了主題演講,正式發(fā)布了華為的新一代移動計算芯片——麒麟 970。

  作為一款為手機設(shè)計的系統(tǒng)級芯片(System On Chip,即 SoC),麒麟 970 包含了所有同類產(chǎn)品該有的部件,比如 CPU、GPU、ISP、DSP、通訊基帶,但麒麟 970 又多了一個所有同類產(chǎn)品都沒有的東西——一顆為人工智能運算專門設(shè)計的 NPU。

  下面我們就 SoC 的各個部件出發(fā),全面地了解一下麒麟 970。

  CPU、GPU:重點是降功耗

  如果你是一個非?粗厥謾C SoC 的 CPU、GPU 極限表現(xiàn)的‘性能黨’,麒麟 970 可能不會讓你太興奮。

  CPU 方面,麒麟 970 的參數(shù)相比麒麟 960 基本沒有任何變化,依然是 8 顆核心,其中 4 顆為高性能的 ARM 公版 A73 架構(gòu),最高主頻 2.4GHz(麒麟 960 是 2.36GHz),4 顆位低功耗的 ARM 公版 A53 架構(gòu),最高主頻 1.8GHz(麒麟 960 是 1.84GHz)。

  有些遺憾的是,麒麟 970 并沒有用上 ARM 在今年 5 月發(fā)布的新一代 Cortex-A75、Cortex-A55 架構(gòu)以及為 AI 相關(guān)運算優(yōu)化的 DynamiIQ 設(shè)計(麒麟 970 選擇了另一種方法來提高 AI 運算)。當(dāng)然了,考慮到 A75 和 A55 的發(fā)布時間、設(shè)計的復(fù)雜程度,麒麟 970 沒用上也是可以理解的。

  在發(fā)布會上,余承東并沒有透露麒麟 970 的 CPU 性能相比 960 的變化,只是表示麒麟 970 的能耗比提升了 20%(主要得益于全新的 10 納米制程)。至于實際的性能表現(xiàn),不出意外的話,麒麟 970 應(yīng)該和麒麟 960 處于同一段位,不會有非常明顯的提升。

  當(dāng)然,橫向來看的話,麒麟 970 的 CPU 性能沒提升其實不是什么大問題。從 GeekBench 4 等跑分軟件的得分上看,麒麟 960 的分數(shù)和高通驍龍 835、三星 Exynos 8895 基本處于同一水準,明顯強于聯(lián)發(fā)科 Helio X30。因此,即使麒麟 970 的 CPU 性能不變,也依然是 Android 陣營里移動 SoC 的頂級水準,只是不再像麒麟 960 發(fā)布時那么領(lǐng)先。

  相比起 CPU 上的保守,麒麟 970 在 GPU 上的‘誠意’要顯得更足一些。

  首先,麒麟 970 則用上了 ARM 在今年 5 月剛剛發(fā)布的 Mali-G72 架構(gòu),理論性能相比麒麟 960 上的 Mali-G71 有所提升(ARM 的官方說法是相比 G71 性能提高 20%,功耗比提升 25%)。此外,在核心數(shù)上,麒麟 970 的 GPU 也從麒麟 960 的 8 核增加到了 12 核。

  實際性能上,余承東表示,相比起麒麟 960,麒麟 970 的性能有 20% 的提升,并且能效比提升了 50%。

  照理說,由于麒麟 970 的 GPU 核心架構(gòu)比麒麟 960 更先進,核心數(shù)還多了 50%,并且制程更先進,GPU 性能提升的幅度應(yīng)該遠不止 20%。之所以出現(xiàn)這種情況,很可能是華為將麒麟 970 的 GPU 主頻壓得比較低,從而更好地降低功耗(于是就有了提升幅度高達 50% 的能效比)。不出意外,麒麟 960 上出現(xiàn)的 GPU‘滿血跑’時功耗感人的情況,麒麟 970 上不會再出現(xiàn)。

  通訊基帶:比‘千兆 LTE’更快

  作為一家通訊行業(yè)有著多年積累的公司,華為海思在通訊基帶上有著深厚的‘家底’,特別是去年的麒麟 960,直接在 SoC 中集成了支持 LTE Cat.12/13 的 Balong 750 基帶(最大下行速度 600Mbps,上行 150Mbps),并且支持 CDMA 網(wǎng)絡(luò),絲毫不遜色同期的高通驍龍 820、821。

  在今年的麒麟 970 上,華為海思更進一步,直接大跨步到了 LTE Cat.18,最高下載速度飆到了 1.2Gbps(4x4 MIMO,3CC CA,256QAM),也就是比之前業(yè)界最快、驍龍 835 和 Exynos 8895‘千兆 LTE’還要再快上 200Mbps。

  麒麟 970 還終于支持了在同時使用兩張 SIM 卡時,主副卡同時用 4G(上一代麒麟 960 的副卡只能支持 3G)。此外,麒麟 970 還特別針對高鐵時的使用做了優(yōu)化,信號更穩(wěn)定,減少掉線。

  不過話還是要說回來,雖然麒麟 970 的通訊基帶的確是厲害,但和驍龍 835、Exynos 8895 等支持千兆 LTE 的 SoC 一樣,普通用戶想要真正體驗到這種超高速 LTE 網(wǎng)絡(luò),還得過上相當(dāng)一段時間。

  一方面,超高速 LTE 網(wǎng)絡(luò)需要運營商的支持,雖然目前全球不少運營商(包括中國聯(lián)通)已經(jīng)開始了千兆級 LTE 的測試,但距離大規(guī)模商用還仍需時日。另一方面,在手機端,除了需要 SoC 自身的基帶支持,如果要支持千兆級的 LTE,手機廠商還必須在手機的天線設(shè)計上投入額外的精力,以搭載驍龍 835 的手機為例,在目前上市的眾多驍龍 835 手機中,真正能支持到千兆 LTE 的只有三星 Galaxy S8、HTC U11 等少數(shù)國際品牌機型的部分型號。

  ISP、DSP、Codec、協(xié)處理器

  ISP 的全稱是 Image Signal Processor(圖像信號處理器),主要功能是處理相機傳感器中收集到的數(shù)據(jù)。

  麒麟 970 的 ISP 主要是一些‘常規(guī)升級’,依然是雙核設(shè)計,擁有更快的速度,更快地對焦,更優(yōu)秀的降噪效果,并且對運動圖像的捕捉做了優(yōu)化。不過相比起單純的 ISP 升級,NPU 對相機體驗的提升可能會更大(下文會詳說)。

  在 DSP、配套 Codec 等方面,麒麟 970 也有所提升,其中配套的音頻 Codec 可以支持 32bit/384k 的音頻解碼,過去幾代華為高端機(Mate、P 系列)上表現(xiàn)乏善可陳的內(nèi)放音質(zhì),有望在麒麟 970 這代產(chǎn)品上獲得明顯的提升,當(dāng)然前提是 Mate 10 和 P11 系列還能保留 3.5 毫米耳機插孔。

  另外,麒麟 970 依然搭載了 i7 協(xié)處理器(和牙膏廠的 i7 沒啥關(guān)系),而 inSE(integrated secure element)和 TEE 安全引擎,在麒麟 970 上也都在。

  在總線架構(gòu)上,不出意外的話,麒麟 970 采用的應(yīng)該是和 960 相同的 CCI-550。

  10 納米制程,比驍龍 835 還多的 55 億個晶體管

  制程上,不出意外,麒麟 970 用上了臺積電(TSMC)最新的 10 納米工藝,這應(yīng)該是繼蘋果 A10X、聯(lián)發(fā)科 Helio X30 之后,第三款采用臺積電 10 納米制程的移動 SoC。

  通常來說,在芯片晶體管數(shù)量相同的情況下,更先進的制程可以降低芯片的核心面積,有助于降低成本,并且更加有效地控制發(fā)熱和功耗。

  在發(fā)布會上,余承東也表示,臺積電的 10 納米制程可以降低 20% 的能耗,將芯片核心面積縮小 40%。

  不過有趣的是,麒麟 970 的核心面積并沒有因為制程的進步而縮小,反而比麒麟 960 還要略大,這是因為麒麟 970 集成了高達 55 億個晶體管,比麒麟 960 多出了 15 億。

  55 億個晶體管是什么概念呢?大家可以參考幾個數(shù)字。

  Intel 在 2014 年發(fā)布的擁有 18 個核心的至強 E5 CPU,也才內(nèi)置了 55.6 億個晶體管。在更具對比價值的移動 SoC 中,以‘堆料’著稱的蘋果 A10 擁有 33 億個晶體管,高通驍龍 835 擁有 31 億個。

  需要說明的是,雖然晶體管數(shù)量對性能有一定的影響,并且通常是越多越好,但在芯片工藝、架構(gòu)不同的情況下,我們是無法簡單地用晶體管數(shù)量來判斷性能的,尤其是在內(nèi)部部件眾多的移動 SoC 中。

  NPU:首款內(nèi)置在手機 SoC 中的人工智能芯片

  終于到了麒麟 970 最特別的部分——NPU。

  NPU 的全稱是 Neural-network Processing Unit,也就是神經(jīng)網(wǎng)絡(luò)處理單元。關(guān)于這顆 NPU 的功能,大家可以簡單理解為專門高效地進行 AI 相關(guān)計算定制的處理器,就像 GPU 之于圖形處理相關(guān)的計算,ISP 之于成像相關(guān)的計算。

  傳統(tǒng)的 CPU(包括 x86 和 ARM)和 GPU 也是可以用來做深度學(xué)習(xí)計算的,但由于它們本身并不是專門為深度學(xué)習(xí)定制的,效率并不高。而麒麟 970 的這顆 NPU 采用了來自寒武紀(Cambricon)的 IP,專門為深度學(xué)習(xí)而定制,F(xiàn)P16 性能達到了 1.92 TFLOP,差不多是麒麟 960 的 3 倍(0.6 TFLOP 左右)。

  在發(fā)布會上,余承東展示了一張在進行 AI 運算時,NPU 和 CPU、GPU 的對比。

  可以看到,性能上,NPU 是 CPU 的 25 倍,GPU 的 6.25 倍(25/4),能效比上,NPU 更是達到了 CPU 的 50 倍,GPU 的 6.25 倍(50/8)。

  另外,在華為內(nèi)部的測試中,麒麟 970 的 NPU 每分鐘可以識別出 2005 張照片,而不使用 NPU 的話則每分鐘只能識別 97 張(這個速度應(yīng)該是用 CPU 進行計算的),優(yōu)勢同樣巨大。

  至于這顆 NPU 具體能實現(xiàn)哪些特別的功能,我們還需要等到 Mate 10、Mate 10 Pro 上來揭曉。在發(fā)布會上,余承東提到了一些 NPU 在拍照方面的應(yīng)用。

  具體到拍照中,NPU 可以幫助手機更精準和快速地識別拍攝場景,讓手機選擇最合適的圖像處理算法,在雙攝背景虛化時,讓手機對邊緣虛化的處理更準確,還有最近很火的 AR 相機,NPU 可顯著提高渲染的速度,降低功耗。

  再比如說,有了 NPU 之后,手機可以將語音和語義識別的部分工作轉(zhuǎn)移到手機本地,提高語音和語義識別的表現(xiàn),提高手機中語音交互應(yīng)用(比如語音輸入法、智能語音助手)的體驗。

  值得一體的是,在發(fā)布會上,余承東還展示了‘開放移動 AI 平臺(Open Mobile AI Platform)’,為 app 開發(fā)者提供了包括開發(fā)者網(wǎng)站和社區(qū)支持、開發(fā)套件以及自家的 app 分發(fā)商店在內(nèi)的‘全套’服務(wù),吸引開發(fā)者開發(fā)可以調(diào)用 NPU 性能的 app。

  不過這里有個問題,這一套方案只是針對搭載麒麟 970 的華為手機的,并不是一個開放的平臺,這意味著開發(fā)者即使寫出來能調(diào)用 NPU 來實現(xiàn)某些強大功能的 app,也只能運行在僅有的幾款華為手機上(短期內(nèi)應(yīng)該只有即將發(fā)布的 Mate 10 和 Mate 10 Pro)。

  至于未來華為能吸引多少開發(fā)者來利用 NPU 開發(fā)支持自家 AI 平臺的 app,現(xiàn)在來看還是個未知數(shù),但至少在接下來的幾個月內(nèi),恐怕更多地需要依靠華為自己的軟件工程師來開發(fā)相應(yīng)的 app。

  當(dāng)手機 SoC 遇到 AI

  對于喜歡折騰手機的用戶來說,手機 SoC 的性能可能永遠都沒有‘過!哪且惶,不過對于更多的‘普通用戶’來說,隨著過去幾年里 SoC 整體性能的不斷提升,新款 SoC 在性能上帶來的體驗加成正在變得越來越小。在 5G 時代到來之前,在移動 VR 和 AR 應(yīng)用取得突破之前,這種情況很可能會一直持續(xù)下去。

  在麒麟 970 上,華為探索了另外一種思路:在傳統(tǒng)的手機 SoC 上,額外增加一顆專門為 AI 相關(guān)運算定制的芯片(NPU),讓手機本身具備 AI 能力,完成一些和 AI 相關(guān)的應(yīng)用。

  至于這顆 NPU 到底能有多大的意義,我們至少還需要等到 10 月 16 日發(fā)布 Mate 10 和 Mate 10 Pro 后才能作出判斷,但可以確定的是,在 AI 席卷整個科技圈的浪潮中,麒麟 970 在 AI 上的探索只是一個開始。

  今年 5 月,ARM 在發(fā)布新一代 CPU 架構(gòu) Cortex-A75 和 A55 時,重點強調(diào)了提高 AI 運算能力的 DynamIQ 設(shè)計。今年 7 月,高通開放了自家的神經(jīng)處理引擎(Neural Processing Engine,NPE)的 SDK,幫助開發(fā)者使用驍龍 SoC 進行 AI 相關(guān)的運算。

  或許到明年這個時候,當(dāng)我們在討論移動 SoC 的時候,AI 芯片就會像 CPU、GPU 那樣,成為智能手機中一個‘常規(guī)’的組成部分。


掃碼關(guān)注5G通信官方公眾號,免費領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費領(lǐng)取《中國移動:5G網(wǎng)絡(luò)AI應(yīng)用典型場景技術(shù)解決方案白皮書
  • 2、回復(fù)“5G6G”免費領(lǐng)取《5G_6G毫米波測試技術(shù)白皮書-2022_03-21
  • 3、回復(fù)“YD6G”免費領(lǐng)取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復(fù)“LTBPS”免費領(lǐng)取《《中國聯(lián)通5G終端白皮書》
  • 5、回復(fù)“ZGDX”免費領(lǐng)取《中國電信5G NTN技術(shù)白皮書
  • 6、回復(fù)“TXSB”免費領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費領(lǐng)取《中國移動算力并網(wǎng)白皮書
  • 8、回復(fù)“5GX3”免費領(lǐng)取《 R16 23501-g60 5G的系統(tǒng)架構(gòu)1
  • 對本帖內(nèi)容的看法? 我要點評

     
    [充值威望,立即自動到帳] [VIP貴賓權(quán)限+威望套餐] 另有大量優(yōu)惠贈送活動,請光臨充值中心
    充值擁有大量的威望和最高的下載權(quán)限,下載站內(nèi)資料無憂

    快速回復(fù)主題    
    標(biāo)題
    內(nèi)容
     上傳資料請點左側(cè)【添加附件】

    當(dāng)前時區(qū) GMT+8, 現(xiàn)在時間是 2025-02-24 12:48:17
    渝ICP備11001752號  Copyright @ 2006-2016 mscbsc.com  本站統(tǒng)一服務(wù)郵箱:mscbsc@163.com

    Processed in 0.610599 second(s), 16 queries , Gzip enabled
    TOP
    清除 Cookies - 聯(lián)系我們 - 移動通信網(wǎng) - 移動通信論壇 - 通信招聘網(wǎng) - Archiver