本文來(lái)自中關(guān)村在線
一夜之間,原本看似對(duì)亞馬遜Echo、Google Home和HomePod毫無(wú)反應(yīng)的BAT紛紛進(jìn)入智能音箱領(lǐng)域,且不說(shuō)是否是中文太難難倒了互聯(lián)網(wǎng)巨頭們,與gadget們的交互方式終于“回”到了人與人最該有的交互方式——語(yǔ)言上面,恐怕你要重新規(guī)劃過(guò)去以智能手機(jī)為中心的智能生活了,可以想見(jiàn)未來(lái)生活方式的大致布局:外事靠手機(jī),家事靠音箱。
智能終端新格局:手機(jī)主外智能音箱主內(nèi)
手機(jī)卸任智能家居管理角色
作為首先“智能”起來(lái)的一代,手機(jī)過(guò)去承載了太多,從個(gè)人娛樂(lè)到智能家居的管理,不可否認(rèn)的是,在后者的關(guān)系里手機(jī)充其量只是一種“高級(jí)遙控器”,我想無(wú)論是作為用戶(hù)的你還是你的愛(ài)機(jī)本身大概都不愿委身于這種身份,這份工作交給智能音箱可以想見(jiàn)是理所當(dāng)然且情理之中——如果你回到家對(duì)于家電們的要求僅僅是換個(gè)臺(tái)、調(diào)個(gè)溫度、開(kāi)個(gè)燈、拉個(gè)窗簾(事實(shí)上它們也只能干這些事情…),翻手機(jī)APP找按鍵想想就是很反人類(lèi)的事情。
盡管手機(jī)能高度整合管理智能家居,但交互仍繁瑣不自然
指令簡(jiǎn)單、上下文容易理解,智能家居領(lǐng)域的管理似乎是以“語(yǔ)音”為交互的智能音箱最合適切入的領(lǐng)域,講了這么久的人工智能也終于以一種普通人最常接觸的方式實(shí)現(xiàn)了商業(yè)化(而不是藏在BAT各類(lèi)服務(wù)背后的算法);一方面這著實(shí)會(huì)使生活變得更加高效,往往需要打開(kāi)電視或者打開(kāi)某個(gè)APP才能干的事情,問(wèn)一句音箱就能搞定,對(duì)于經(jīng)常購(gòu)買(mǎi)的物品也完全可以交給它來(lái)代辦(女生就夠嗆了)。另一方面考慮到這東西的盈利模式未定,要是在回答你的同時(shí)插播一段廣告……那就不好了。
語(yǔ)音成了技術(shù)突破后最直接自然的方式
實(shí)際上廣告公司Google已經(jīng)在這么做了,Twitter上曾有一段關(guān)于Google Home的視頻,一位用戶(hù)向Google Home詢(xún)問(wèn)道:“Okay, Google,我今天的安排是什么?”Google Home先是談到了天氣、交通,然后說(shuō):“順便說(shuō)一句,迪士尼真人版電影《美女與野獸》今天上映。”隨后,Google Home開(kāi)始播放音樂(lè)和其它電影評(píng)論。
語(yǔ)音能走多遠(yuǎn)直接取決于AI
由于跟人工智能發(fā)展程度相關(guān)聯(lián),這種交互能否在所有地方都代替?zhèn)鹘y(tǒng)還要兩說(shuō),聯(lián)想到日本常見(jiàn)的自動(dòng)點(diǎn)餐機(jī),這在當(dāng)?shù)厥且环N極為有效率和節(jié)省人力成本的方式,對(duì)于店家已經(jīng)“固化”的菜單來(lái)說(shuō),顧客完全不用等待服務(wù)員招待,機(jī)器上戳幾下就能夠吃上一頓,換做智能音箱,畫(huà)風(fēng)可能是這樣的:“Hi一蘭,我要一碗豬豚骨拉面,加半份面和一個(gè)溫泉蛋”……可能并不如戳幾下有效率。
與其他交互不同,語(yǔ)音能走多遠(yuǎn)直接取決于AI
不知每次提到智能音箱,你是否會(huì)想起當(dāng)年的Siri,然后暗自感嘆蘋(píng)果的這一盤(pán)大旗。然而這也不能怪科技公司無(wú)作為,“攻克”語(yǔ)音這樣一種人類(lèi)最原始的交互方式比設(shè)計(jì)按鈕和觸摸屏幕難上百倍,識(shí)別率尚且不高,更要命的是上下文語(yǔ)意的理解,特別是面對(duì)中文對(duì)一個(gè)意思少則幾種、多則幾十種的說(shuō)法,老外尚且覺(jué)得學(xué)起來(lái)很難,更不用說(shuō)機(jī)器了。所以直到人工智能大行其道的近年才頻繁有公司嘗試這種以語(yǔ)音交互為主的產(chǎn)品。

以阿里剛剛發(fā)布的天貓精靈X1為例,背后的AliGenie平臺(tái)就融合阿里積累多年的語(yǔ)音識(shí)別、自然語(yǔ)言處理、人機(jī)交互、聲紋識(shí)別等技術(shù),阿里人工智能實(shí)驗(yàn)室的語(yǔ)義理解系統(tǒng)還帶有記憶功能和總結(jié)歸納能力,加入了模擬的“長(zhǎng)期記憶”和“短期記憶”功能,能夠針對(duì)不同的場(chǎng)景和時(shí)間度,讓語(yǔ)義理解系統(tǒng)更加貼近用戶(hù)。除此之外,阿里人工智能實(shí)驗(yàn)室還已經(jīng)著手其他多個(gè)語(yǔ)種的研究。
服務(wù)體驗(yàn)壁壘或越來(lái)越少
利益所造就,移動(dòng)互聯(lián)網(wǎng)生態(tài)下雖然每個(gè)APP以及背后的服務(wù)提供商所提供的服務(wù)都無(wú)比強(qiáng)大,但APP與APP間的體驗(yàn)?zāi)壳皝?lái)說(shuō)還是割裂開(kāi)的:如果不是摩拜進(jìn)駐高德,你想要一邊騎行一邊導(dǎo)航只能用摩拜的APP掃開(kāi)單車(chē)再去用高德的地圖規(guī)劃路線,這樣的問(wèn)題將在智能音箱領(lǐng)域持續(xù)存在,然而好的方面是,國(guó)內(nèi)互聯(lián)網(wǎng)公司合作頻頻所造就的阿里系、騰訊系、百度系旗下都擁有各自的一套移動(dòng)互聯(lián)網(wǎng)服務(wù)生態(tài)體系,似乎會(huì)為過(guò)去割裂的服務(wù)體驗(yàn)鋪就越來(lái)越平坦的路。


復(fù)雜“工況”依然需要手機(jī)存在
至于家居以外,恐怕還得繼續(xù)用智能手機(jī)來(lái)接管,不同于智能家居一般都是硬件范疇,通過(guò)手機(jī)獲取的服務(wù)大多是虛擬且指令復(fù)雜的,而且調(diào)用的硬件種類(lèi)無(wú)比多,所需要的計(jì)算能力也要遠(yuǎn)比大多數(shù)情況下僅作為入口作用的音箱要多。
而且智能手機(jī)所能行使的任務(wù)之復(fù)雜,APP UI設(shè)計(jì)之不同,短時(shí)間內(nèi)交互只能借由精準(zhǔn)的按鈕、觸控、菜單、列表來(lái)實(shí)現(xiàn)了,甭說(shuō)音箱,就連“語(yǔ)音”這件事大概也只能做些輸入文字之類(lèi)的事情,手機(jī)上的“語(yǔ)音助手”可能在未來(lái)遠(yuǎn)沒(méi)有在智能音箱上有潛力。
再者從設(shè)備形態(tài)上來(lái)說(shuō),帶個(gè)音箱出門(mén)…如果非要有什么另一種形態(tài)的智能設(shè)備能夠接管你在家居之外的只能生活,成為一種新的移動(dòng)計(jì)算中心,大概只能是未來(lái)硬件發(fā)展足夠成熟的穿戴類(lèi)或者M(jìn)R混合現(xiàn)實(shí)眼鏡。