
歡迎關(guān)注“創(chuàng)事記”的微信訂閱號(hào):sinachuangshiji
文/允中 來(lái)源:量子位(QbitAI)
羅振宇:有沒(méi)有人認(rèn)為羅永浩是一個(gè)外行?
羅永浩:第一代硬件發(fā)布會(huì)的時(shí)候,有人說(shuō)你懂個(gè)屁手機(jī)。我不懂人工智能,人家問(wèn),我就聊了。有人就說(shuō)你聊什么人工智能,你還是說(shuō)相聲去吧。
羅永浩這次一句“人工智能”也沒(méi)提。
上周,錘子科技新款手機(jī)發(fā)布。照例,有褒有貶。關(guān)于手機(jī)本身,量子位不想過(guò)多評(píng)論,我們更關(guān)心期間展示的一些人機(jī)交互方式。
羅永浩談?wù)摰暮芏唷败浶浴辟u點(diǎn),招招式式全跟AI有關(guān)。
這位錘子科技創(chuàng)始人的觀點(diǎn)是:如果一個(gè)全知全能的“語(yǔ)音助手”還不能實(shí)現(xiàn),那就先通過(guò)工具性產(chǎn)品提升用戶效率。
去年10月,也是錘子的一場(chǎng)發(fā)布會(huì),突然讓科大訊飛火了一把。這次錘子新品背后,又是哪些人工智能公司在支撐?
AI伙伴
在堅(jiān)果Pro發(fā)布會(huì)上,錘子科技在手機(jī)上的AI變革,一目了然。
首先可以從系統(tǒng)層面來(lái)看,錘子的打法是通過(guò)系統(tǒng)功能,讓錘子手機(jī)用戶在具體場(chǎng)景中體驗(yàn)更好、效率更高。其次是工具性產(chǎn)品打造,通過(guò)工具性產(chǎn)品,解決用戶核心痛點(diǎn)和改善用戶體驗(yàn)。
這些應(yīng)用的背后技術(shù)方案提供商,也無(wú)一例外來(lái)自人工智能領(lǐng)域;而軟件交互方面的創(chuàng)新,都與人工智能最新進(jìn)展密不可分,在此量子位一一拆解挖掘:
1)短信退訂
“短信退訂”背后的技術(shù)提供商是小源科技,這是一家垂直于短信、利用語(yǔ)義分析場(chǎng)景、建立機(jī)器模型的公司,他們更加為人所知的產(chǎn)品名稱是“信析寶”,主要應(yīng)用形式是將航班信息等短信卡片化——更美觀、更實(shí)用、并且可以直接跳轉(zhuǎn)到相關(guān)App。
不過(guò),這一次放在錘子科技發(fā)布會(huì)上展示的是“短信退訂”的問(wèn)題,這是目前短信騷擾最頭疼的問(wèn)題之一,而錘子和小源的結(jié)合,則為功能式解決首開(kāi)案例。
小源科技負(fù)責(zé)對(duì)外戰(zhàn)略合作的合伙人段旭告訴量子位,“短信退訂”背后主要涉及的是“自然語(yǔ)言理解”和“場(chǎng)景識(shí)別”等兩大內(nèi)容。
首先是“自然語(yǔ)言理解”,即通過(guò)機(jī)器“讀取”短信內(nèi)容,判斷短信內(nèi)容、類型和所屬場(chǎng)景。
其次是“場(chǎng)景識(shí)別”,需要判斷短信是一般退訂短信,還是帶有通知內(nèi)容的退訂短信,再在用戶最終決策后,一鍵完成退訂,并且不會(huì)給發(fā)送短信方造成“回復(fù)證明活躍”的現(xiàn)象。
小源方面稱,這背后是短信內(nèi)容大數(shù)據(jù)的積累,以及內(nèi)容場(chǎng)景模型的精準(zhǔn)構(gòu)建。
2)虛擬來(lái)電
“虛擬來(lái)電”是發(fā)布會(huì)會(huì)中和會(huì)后受到爭(zhēng)議的功能,在“道德與否”的問(wèn)題上,引發(fā)了廣泛討論。然而就技術(shù)而言,這已然是人工智能領(lǐng)域相對(duì)成熟、且被廣泛應(yīng)用的技術(shù)。
具體提供商方面,錘子引用了科大訊飛的“配音閣”,這是訊飛主打語(yǔ)音合成方案的平臺(tái)名稱,該平臺(tái)可以按需提供個(gè)性化語(yǔ)音合成,能夠通過(guò)簡(jiǎn)單而基本的語(yǔ)料信息,合成具體語(yǔ)言、具體語(yǔ)種和具體個(gè)人口音的語(yǔ)音信息。
更早之前,在錘子科技去年10月的新品發(fā)布會(huì)后,科大訊飛的“配音閣”已經(jīng)在錘子科技系列新品發(fā)布會(huì)前后大放異彩,主要是通過(guò)合成羅永浩、奧巴馬等的口音,實(shí)現(xiàn)機(jī)器語(yǔ)音的“個(gè)性化”。
值得注意的是,雖然錘子科技功能化產(chǎn)品“虛擬來(lái)電”受到爭(zhēng)議,但該技術(shù)的實(shí)際應(yīng)用卻廣泛得多。
比如現(xiàn)在不少快遞企業(yè),已經(jīng)在通過(guò)“虛擬來(lái)電”的方式,讓機(jī)器來(lái)通知物流快遞信息,而一些售后和客服任務(wù)較重的行業(yè),也已經(jīng)上馬了該技術(shù)。
這也是客服行業(yè)和配音行業(yè)正在經(jīng)歷的大變革。
除了科大訊飛,宣布AI轉(zhuǎn)型的百度也在這方面秀過(guò)肌肉,在2016年百度世界大會(huì)上,李彥宏就展示過(guò)人工智能充當(dāng)客服帶來(lái)的效果,不僅成本降低,而且準(zhǔn)確度,以及對(duì)用戶非結(jié)構(gòu)化數(shù)據(jù)的整合方面,效果都極其明顯。
此外,就著當(dāng)紅演藝明星胡歌的面,李彥宏還讓機(jī)器模仿胡歌的“口音口吻”,除了感情色彩上稍遜一籌,已屬惟妙惟肖——李彥宏說(shuō),人工智能正在搶走配音師的飯碗。
3)智能語(yǔ)義拖拽
當(dāng)然,錘子發(fā)布會(huì)聽(tīng)起來(lái)最具普惠意義的莫過(guò)于“智能語(yǔ)義拖拽”,這是一個(gè)高速公路一樣的功能,在分割林立的手機(jī)App之間架起直通管道,減輕App間切換的痛苦,同時(shí)提升手機(jī)使用效率。
具體來(lái)看,“智能語(yǔ)義拖拽”就是把微信、短信等對(duì)話過(guò)程中產(chǎn)生的信息進(jìn)行分析,按照所屬直接在地圖導(dǎo)航、美食評(píng)價(jià)和日程日歷等產(chǎn)品中使用。
但值得注意的是,錘子最終展現(xiàn)的“智能語(yǔ)義拖拽”是一個(gè)一步到位的功能,用戶可以直接將一段文字拖入相關(guān)App中,而機(jī)器會(huì)在該過(guò)程中分析信息內(nèi)容、提取核心相關(guān)信息、并且讓各個(gè)App各司其職——快速幫助用戶完成目的。
實(shí)際上這個(gè)過(guò)程中,錘子還進(jìn)一步整合了上次推出的“大爆炸”和“一步”兩大功能。
此次智能語(yǔ)義拖拽背后的技術(shù)提供方是三角獸科技,這是這家初創(chuàng)公司第二次出現(xiàn)在錘子發(fā)布會(huì)上,上一次雙方合作的產(chǎn)品是“Big Bang”(大爆炸)。
據(jù)量子位了解,主打智能語(yǔ)義分析三角獸,在該功能從無(wú)到有誕生的過(guò)程中,總共向錘子科技派出了3名工程師,共計(jì)耗時(shí)3個(gè)月,最大挑戰(zhàn)來(lái)自手機(jī)場(chǎng)景下的技術(shù)方案落地問(wèn)題——在此之前并沒(méi)有廠商做出過(guò)嘗試。
三角獸技術(shù)負(fù)責(zé)人稱:智能語(yǔ)義拖拽涉及的是NLP中最核心最具挑戰(zhàn)的問(wèn)題,通俗來(lái)講就是讓機(jī)器斷句,且學(xué)會(huì)中文語(yǔ)境下的“預(yù)感”,進(jìn)而才能搭建機(jī)器學(xué)習(xí)模型。
不過(guò),在和錘子一起開(kāi)發(fā)“智能語(yǔ)義拖拽”的過(guò)程中,最大的挑戰(zhàn)來(lái)自如何在手機(jī)場(chǎng)景下,最低限度降低機(jī)器模型對(duì)CPU、計(jì)算功耗等方面的消耗。
而且作為一個(gè)功能型產(chǎn)品,還需要考慮聯(lián)網(wǎng)和本地兩種交替情況下如何保證速度,因?yàn)榉磻?yīng)速度會(huì)直接影響用戶體驗(yàn)。
“更傾向于合作方是使用網(wǎng)絡(luò)版的接口,但因?yàn)槭謾C(jī)涉及用戶隱私,或網(wǎng)絡(luò)情況不佳,就可能需要用到離線版本。
然而緊接著需要解決的問(wèn)題是離線版本對(duì)系統(tǒng)資源的占用,此外運(yùn)算速度如果太長(zhǎng)就會(huì)比較傷害用戶體驗(yàn)。”三角獸工程師說(shuō),同時(shí)表示這是最大的考驗(yàn)。
然而,這個(gè)最大考驗(yàn)解決后,獲利方也將最大化。
在錘子方面的合作實(shí)現(xiàn)后,三角獸工程師也坦言,可以無(wú)障礙適配到更多的手機(jī)產(chǎn)品中。
雖然之前并沒(méi)有其他手機(jī)廠商擁有這樣的需求,但在此次堅(jiān)果Pro的合作中,三角獸和錘子一起完成了從最低配版本的堅(jiān)果手機(jī),但最高配版本的旗艦機(jī)M1L的適配——遷移的成本已經(jīng)很小了。
這也意味著,一旦其他手機(jī)廠商跟進(jìn)遷移該功能,未來(lái)大量涉及不同應(yīng)用間切換的內(nèi)容,都將變得 so easy,比如微信中約定吃飯的時(shí)間地點(diǎn),同時(shí)將內(nèi)容拖拽入“日歷”、“地圖”和“大眾點(diǎn)評(píng)”等應(yīng)用中即可。
4)閃念膠囊
“閃念膠囊”是個(gè)新鮮事,但偉大的是解決問(wèn)題的出發(fā)點(diǎn),而非實(shí)現(xiàn)的技術(shù)難度上。
坦白講,這只是一次“語(yǔ)音備忘錄”和“語(yǔ)音識(shí)別”的功能綜合,但正如羅永浩所言,這幾年來(lái),并沒(méi)有人為此付出過(guò)實(shí)際性舉動(dòng),并且難能可貴的是,錘子將通過(guò)開(kāi)源,讓跟多非錘子手機(jī)用戶也能使用。
這也是錘子AI工具產(chǎn)品思路中的集大成之作。除了語(yǔ)音識(shí)別,“閃念膠囊”背后還應(yīng)用了智能語(yǔ)音拖拽、大爆炸和一步。
在接受量子位的采訪中,科大訊飛方面的負(fù)責(zé)人表示,此次也在“閃念膠囊”中和錘子進(jìn)行了協(xié)作,主要涉及語(yǔ)音識(shí)別方面。
與“智能語(yǔ)義拖拽”面臨的問(wèn)題相似,“閃念膠囊”最大的問(wèn)題是如何在手機(jī)設(shè)備下實(shí)現(xiàn)對(duì)資源的合理調(diào)用。
如羅永浩發(fā)布會(huì)上所言,最后錘子和訊飛給出的方案是:首選聯(lián)網(wǎng)識(shí)別,但如果網(wǎng)絡(luò)情況不佳,則先使用訊飛語(yǔ)音識(shí)別本地方案,再在網(wǎng)絡(luò)情況良好時(shí)聯(lián)網(wǎng)修正。

語(yǔ)音識(shí)別和自然語(yǔ)言理解
不難發(fā)現(xiàn),錘子新品發(fā)布會(huì)上重點(diǎn)推出的工具產(chǎn)品/功能,背后的主要技術(shù)是語(yǔ)音識(shí)別和自然語(yǔ)言理解及處理,這也是目前人工智能最成熟、進(jìn)展最快的兩大領(lǐng)域,也是中國(guó)人工智能公司全球領(lǐng)先的領(lǐng)域。
語(yǔ)音識(shí)別方面,從科大訊飛、百度,到搜狗,都已經(jīng)在大語(yǔ)料數(shù)據(jù)庫(kù)的基礎(chǔ)上,將語(yǔ)音識(shí)別的準(zhǔn)確率提升到了97%以上,這在國(guó)際公認(rèn)的標(biāo)準(zhǔn)參數(shù)都已然處于領(lǐng)先,并且訊飛還實(shí)現(xiàn)了方言領(lǐng)域的高識(shí)別率,可以說(shuō)這是錘子可以實(shí)現(xiàn)一系列語(yǔ)音交互為基礎(chǔ)的產(chǎn)品的底氣所在。
通常情況下,相比鍵盤為代表的文字輸入,語(yǔ)音要高效很多。這也是目前最被看好的新一代人機(jī)交互技術(shù),包括亞馬遜、谷歌、微軟、百度和訊飛在內(nèi)的公司,都在積極推動(dòng)語(yǔ)音識(shí)別為核心的交互平臺(tái)的運(yùn)用,希望自己的語(yǔ)音交互平臺(tái),會(huì)成為下一個(gè)iOS、下一個(gè)安卓。
自然語(yǔ)言理解方面,百度的度秘、微軟的小冰,以及三角獸等為代表的創(chuàng)業(yè)新勢(shì)力,都已經(jīng)取得了不俗的進(jìn)展。無(wú)論是小冰的聊天,百度的“讀”新聞,三角獸的中文斷句,都在自然語(yǔ)言理解、自然語(yǔ)義處理方面,為錘子的產(chǎn)品式整合掃清了障礙。
可以說(shuō),這是人工智能進(jìn)展給于錘子的機(jī)會(huì),但同時(shí)也是手機(jī)行業(yè)正在經(jīng)歷的技術(shù)變革——與芯片、工業(yè)設(shè)計(jì)等硬件大戰(zhàn)不同,這一次革命將體現(xiàn)在“軟件”上。
智能手機(jī)正迎來(lái)新時(shí)代
今年3月,量子位曾有文章稱《沒(méi)有人工智能的硬件,未來(lái)可能不配叫智能硬件》,當(dāng)時(shí)三星新旗艦Galaxy S8發(fā)布會(huì)上,安卓陣營(yíng)巨頭推出了人工智能助手Bixby,這是一個(gè)類似蘋果Siri的產(chǎn)品。
同時(shí)也是羅永浩所稱的全局性解決問(wèn)題的語(yǔ)音助手產(chǎn)品,即便他暫時(shí)不看好,也已經(jīng)賽道密集潮水洶涌。

在國(guó)內(nèi),華為率先在國(guó)產(chǎn)手機(jī)中推出了語(yǔ)音助手產(chǎn)品“小E”,讓用戶用自然語(yǔ)言的方式,向它求助在手機(jī)使用過(guò)程中遇到的各種問(wèn)題,但具體使用情況來(lái)看,用戶需求度還不高,場(chǎng)景尷尬的問(wèn)題始終沒(méi)有得到解決。
此外,另一種利用AI全局性解決問(wèn)題的產(chǎn)品是“系統(tǒng)優(yōu)化”,通過(guò)個(gè)性引擎,在用戶使用習(xí)慣的基礎(chǔ)上形成用戶畫(huà)像,然后在使用過(guò)程中實(shí)現(xiàn)“預(yù)判”和“推薦”。
比如從EMUi5.0系統(tǒng)開(kāi)始,華為便開(kāi)始對(duì)外宣稱手機(jī)系統(tǒng)能夠?qū)W習(xí)用戶的操作行為,通過(guò)這種方式,系統(tǒng)將可以實(shí)現(xiàn)對(duì)用戶操作的提前預(yù)判,依此進(jìn)行資源的合理分配,從而為用戶帶來(lái)更加流暢的體驗(yàn)。
同樣方向出發(fā)的還有魅族。這家總部位于珠海的手機(jī)廠商,在2016年年底伴隨手機(jī)系統(tǒng)Flyme6推出了“One Mind”,這是一個(gè)通過(guò)用戶畫(huà)像幫助手機(jī)用戶完成分析、決策的內(nèi)置程序,最突出的亮點(diǎn)是幫助CPU提升運(yùn)行效率、進(jìn)而提升用戶體驗(yàn)。
當(dāng)然,沒(méi)有在系統(tǒng)方面明確宣稱人工智能進(jìn)展的小米,也在利用AI提升用戶體驗(yàn),比如在個(gè)性拍照和相冊(cè)歸類等方面的應(yīng)用,背后是機(jī)器視覺(jué)方面的能力。而且值得注意的是,小米已經(jīng)在電視等產(chǎn)品中實(shí)現(xiàn)了語(yǔ)音助手、興趣引擎等方面的落地,相信手機(jī)場(chǎng)景下的應(yīng)用,也只是時(shí)間問(wèn)題而已。
最后,讓我們?cè)倩氐藉N子科技的堅(jiān)果Pro發(fā)布會(huì)。雖然長(zhǎng)達(dá)3小時(shí)的演講展示中,羅永浩只字未提“人工智能”,但通不難看出錘子科技想要改變的現(xiàn)狀——智能手機(jī)產(chǎn)品創(chuàng)新遭遇瓶頸的現(xiàn)狀,需要新技術(shù)新交互提升易用性的現(xiàn)狀。
羅永浩說(shuō),錘子只有現(xiàn)在做好準(zhǔn)備,才能在下一代人機(jī)交互革命中成為上桌選手,才能由此實(shí)現(xiàn)“大到嚇人”的野心。
想這么干的不止羅永浩。
下一代人機(jī)交互革命正在加速到來(lái),正在AI浪潮中日漸清晰。