飛象網訊(魏德齡/文)“手機用得好好的,為什么要換?”這或許是近年來很多人產生換機沖動時,所必須直面家人的靈魂拷問。誠然,手機的CPU與GPU性能在近年來依舊在穩(wěn)步前進,但對于不進行大型3D游戲的用戶來說,所產生的日常使用提升正在變得微乎其微。
不過,隨著ChatGPT在2023年的異軍突起,也為智能設備的需求瓶頸給出了一個靠譜的答案。從應用商店排行榜上來看,即便過了發(fā)布后下載熱潮的ChatGPT客戶端,如今仍能占據蘋果App Store排行榜前20位,各類基于開發(fā)接口所打造的第三方App或插件更是不計其數。
盡管熱度不小,但其實用戶在移動端的體驗確實談不上好,但好用又不好用的生成式AI卻又映射出了未來“換手機”時的新答案。
好用又不好用的生成式AI
生成式AI至少已經成為了潛在的殺手級應用,ChatGPT自2022年11月推出后,短短兩個月內其月活用戶便達到 1 億,成為有史以來增長速度最快的消費類應用。大型聚合網站的數據顯示,目前已有超過 3,000 個可用的生成式 AI 應用和特性。據初步估計顯示,生成式 AI 市場規(guī)模將達到 1 萬億美元 ,廣泛覆蓋生態(tài)鏈的各個參與方。
ChatGPT 和 Stable Diffusion 等生成式 AI 模型能夠基于簡單的提示創(chuàng)作出全新的原創(chuàng)內容,如文本、圖像、視頻、音頻或其他數據。這類模型正在顛覆傳統(tǒng)的搜索、內容創(chuàng)作和推薦系統(tǒng)的方法――通過從普通產業(yè)到創(chuàng)意產業(yè)的跨行業(yè)用例,在實用性、生產力和娛樂性方面帶來顯著增強。 建筑師和藝術家可以探索新思路,工程師可以更高效地編寫程序。幾乎所有與文字、圖像、視頻 和自動化相關的工作領域都將受益。
但相比于通過網頁在線與ChatGPT進行對話,并獲得相應的生成式AI結果,移動端使用生成式AI時有著并不相同的使用場景,用戶往往不能擁有一個穩(wěn)定高速的云連接環(huán)境,所以相比響應迅速、節(jié)能高效的移動智能時代來說,使用云端生成式AI時,用戶仿佛回到了智能手機初期發(fā)展的時代,生成式AI在搜索、翻譯上所帶來的強大能力讓人用后很容易產生粘性,但又需要在使用中多上一份耐心,多等待下云端的思考與轉圈圈,才能獲得自己想要的答案。
另一方面,如同當下很多公司的云策略已經從公有云變?yōu)榛旌显频谋澈筮壿嫞瑔渭円蕾囉谀骋患业脑贫怂懔,顯然不夠安全,用戶的所有對話均會被單一廠商所收集,隱私問題將會變得棘手。同時,如果用戶或公司嚴重依賴某一家公司在云端所帶來的AI能力,也不利于在未來靈活地使用各種工具。
完全依靠云端的AI算力,也帶來了能耗的問題。伴隨著ChatGPT的大熱,業(yè)內的一個有趣觀點就是,AI的瓶頸將是數據中心的散熱問題,很多水冷方案也借此應運而生。同時,當本地設備進行大數據量的通信交互時,同樣會產生較大的能耗,進而給網絡帶來壓力,并影響本地設備的續(xù)航。
不過,如同在當下已經成為主流之選的混合云,混合AI成為了讓生成式AI能夠實現(xiàn)體驗升級與規(guī)模化擴展的良方。
混合AI實現(xiàn)體驗提升
“當前很多人將生成式AI和云端聯(lián)系在一起,而通過高通的技術,我們能夠讓這些出色的用例在邊緣側實現(xiàn)!备咄夹g公司產品管理高級副總裁兼AI負責人Ziad Asghar在上月的高通AI業(yè)務媒體溝通會上表示。
同期,高通還發(fā)布了《混合AI是AI的未來》的白皮書,在第一部分專門為混合式AI做出了如下定義:混合 AI 指終端和云端協(xié)同工作,在適當的場景和時間下分配 AI 計算的工作負載,以提供更好的體驗,并高效利用資源。
通過終端側AI算力與云端的結合,恰恰能夠解決目前生成式AI完全依靠云端而出現(xiàn)的各種隱憂。例如在功耗方面,如果在云端運行一個超過10億參數的生成式AI模型,可能需要數百瓦功耗的話,但在終端側運行需要的功耗僅有幾毫瓦。
另以高通在今年巴展期間所帶來的Stable Diffusion在Android終端上的演示為例,能夠在15秒內完成20步推理,生成包含細節(jié)的圖像,整個過程全部在本地化進行,即使手機設置成飛行模式,也能完成根據文字描述所進行的繪畫創(chuàng)作任務。這種特性既為用戶帶來了更加靈活高效的使用方式,又大大提升了隱私保護性。
混合式AI還能讓更多類型的終端受益,例如驍龍本通過生成式AI能夠基于視頻會議的語音轉錄內容,制定任務清單,并自動生成完整的演示文稿直接供用戶使用,使生產力能夠成倍增長;XR設備能夠借此實現(xiàn)文本生成 3D 和視頻生成 3D 類的模型,最終或能讓用戶踏入從零開始生成的 3D 虛擬世界;汽車能夠通過生成式AI根據出發(fā)點和目的地信息,結合汽車的豐富傳感器數據制定不同的路線規(guī)劃,找到最佳路線;物聯(lián)網領域,生成式 AI 可以利用簡單提示幫助商店經理重新排列貨架商品,為利潤高的產品騰出空間,或者利用附近連鎖店的數據,盡可能降低產品缺貨情況的發(fā)生。
“隨著我們不斷打造和擴展高通公司‘統(tǒng)一的技術路線圖’,我們將核心的硬件、軟件以及工具技術擴展到不同產品線。開發(fā)人員只需要進行一次開發(fā),就可以將開發(fā)成果和經驗應用于其他使用高通技術和平臺的產品上。”Ziad Asghar表示高通的AI能力不僅能擴展至不同的終端,還能讓AI應用實現(xiàn)在各類產品上的快速落地。
顯然,相比于CPU、GPU在性能過剩時代對于游戲表現(xiàn)的提升,AI能力的提升在辦公、影音、日常生活中所帶來的提升將給絕大多數用戶帶來理由充分的換機動機,而AI的性能與應用領域也將如同曾經智能手機CPU主頻從600MHz到1GHz、再到2GHz的時代一樣,迎來快速提升期。
智能設備的新剛需
“最終,AI 能力將成為用戶選購下一款手機、PC 或汽車的主要影響因素!薄痘旌螦I是AI的未來》白皮書第二部分中寫到。
只要關注近年來高通驍龍技術峰會上的驍龍8系平臺的發(fā)布環(huán)節(jié)就能發(fā)現(xiàn),AI早就已經成為了每次高通著重升級并介紹的重點。如今隨著生成式AI迎來iPhone時刻,高通為終端側所預埋的AI算力,可謂是金子終于迎來了發(fā)光時刻。
早在2007年,高通在驍龍平臺上便推出了首個 Hexagon 處理器。2015 年,驍龍 820 處理器推出,集成了首個專門面向移動平臺的高通 AI 引擎,以支持圖像、音頻和傳 感器的運算。2018 年,驍龍 855 中為 Hexagon 處理器增加了張量加速器。2019 年,高通在驍龍 865 上擴展了終端側 AI 用例,包含 AI 圖片、AI 視頻、AI 語音和始終在線的傳感器中樞。
2022年發(fā)布的第二代驍龍8 為整個系統(tǒng)提供了開創(chuàng)性的 AI 技術,搭載了迄今為止最快、最先進的高通 AI 引擎。Hexagon處理器實現(xiàn)全新架構升級,包括微切片推理,和一個更大的張量加速器帶來高達4.35倍的AI性能提升。第二代驍龍8也是首個支持變革性的INT4 AI精度格式的驍龍移動平臺,在持續(xù)AI推理方面能夠實現(xiàn)60%的能效提升。
目前,搭載高通 AI 引擎的產品出貨量已超過 20 億,賦能極為廣泛的終端品類,包括智能手機、XR、平板電腦、PC、安防攝像頭、機器人和汽車等。
數量可觀的生成式 AI 模型可從云端分流到終端上運行
也正基于終端側AI算力的保障,才能實現(xiàn)本地運行Stable Diffusion的能力。在《混合AI是AI的未來》白皮書中第一部分中專門列出了不同生成式AI用例所對應的模型規(guī)模數量,從圖表中就能發(fā)現(xiàn),不少功能的模型參數在 10 億至 100 億之間,意味著完全可以在終端側運行豐富的生成式 AI 功能,例如文字生成圖像、組合優(yōu)化、圖像理解等。據Ziad Asghar透露,通過與合作伙伴的共同努力,普通用戶將能在今年體驗到如Stable Diffusion這樣的終端側用例。
與此同時,未來幾個月內,高通將有望支持參數超過100億的模型在終端側運行。Ziad Asghar表示,這也將成為基于高通技術產品的一大差異化優(yōu)勢。
《混合AI是AI的未來》白皮書預計,在混合AI的助力下,智能手機將成為真正的數字助手。精準的終端側用戶畫像與能夠理解文字、語音、圖像、視頻和任何其他輸入模態(tài)的大語言模型相結合,讓用戶可以自然地溝通,獲取準確、貼切的回答。進行自然語言處理、 圖像理解、視頻理解、文本生成文本等任務的模型將面臨高需求。
相比PC,智能手機自面世之初,就是一臺體驗為先的設備,所有對于跑分的執(zhí)念也皆源于對于使用體驗的一種數值預期。當AI開始接過智能手機繼續(xù)發(fā)展的風向標,用戶在購買新設備時,將開始逐漸將關注重點轉移到AI算力與配套用例支持情況上,智能手機的需求瓶頸或許將迎刃而解。