電話的從發(fā)明至今已經(jīng)有上百年的歷史了,在這上百年里,人類與電話的交互方式也悄然發(fā)生了質(zhì)的改變。直到手機(jī)被發(fā)明后標(biāo)志著智能時代的到來。而智能手機(jī)交互方式卻變得止步不前,除了觸摸還是觸摸,就沒有點(diǎn)新鮮的嗎?我們每天捧著手機(jī)刷朋友圈,打農(nóng)藥真的以為我們是在玩手機(jī)?而不是手機(jī)玩我們?
筆者認(rèn)為,智能手機(jī)應(yīng)該是無時無刻可以聽懂人話,才叫智能。而恰逢此時智能語音助手的出現(xiàn)才讓我們充分感覺到了智能的存在。那么在了語音交互之前我們還是先來看看從古至今,人類在信息交互上是如何發(fā)展的吧。
快搬小板凳 開始講課了
通訊基本靠吼 傳遞基本靠腿
在古代,人類沒有的傳遞信息方式靠的就是一張嘴,一雙腿。馬拉松的故事大家應(yīng)該都聽過,一名雅典士兵靠著一雙腿跑回了故鄉(xiāng)告訴部隊(duì)勝利的消息。那個年代人類更多的通訊交互方式是靠自身或是以動物為載體來傳達(dá)。
人類因電話發(fā)明而改變
140年前電話誕生后,人類通訊才真正意義上有了交互。電話的發(fā)展歷史就是一篇人類通訊史。電話的出現(xiàn)讓人與人之間變得更近,也讓世界變得越來越小。而最早的電話使用最廣的則是在戰(zhàn)爭領(lǐng)域。
手搖式電話機(jī)(圖片來自網(wǎng)絡(luò))
手搖電話機(jī)在戰(zhàn)場中運(yùn)用的最為廣泛,前線指揮官在電話上搖兩下就可以接到后方指揮官。那時候的電話機(jī)屬于單線聯(lián)系,無需撥號但需要人工連線才能幫忙接通。
不過隨著改革開放的到來,“樓上樓下,電燈電話”的夢想在千百中國人心中扎根,那些年家里能有個電話已經(jīng)是富貴的象征。而那時候電話座機(jī)與目前其實(shí)模樣相差并不多,采用數(shù)字鍵撥號來與電話控制。
1973年美國摩托羅拉發(fā)明了第一款推向民用的移動電話,但人與電話之間依然是靠按鍵的形式進(jìn)行交互,而知道2007年喬老爺子發(fā)布第一款iPhone后,交互方式才徹底被改變。
喬布斯發(fā)布第一代iPhone
觸摸的交互形式其實(shí)并非蘋果首創(chuàng),但蘋果在當(dāng)時將觸摸的體驗(yàn)做到最好。那時候大家才發(fā)覺到屏幕還能如此一般的觸摸簡直不可思議,都被那絲滑的流暢和多點(diǎn)觸控帶來的良好體驗(yàn)所折服。
智能語音不是聊天機(jī)器人
縱觀整個手機(jī)和電話發(fā)展史,人類與電話之間的交互不管是搖還是按,再到觸摸,都沒有離開過我們的雙手。如今智能的功能越做越豐富,而在交互邏輯上除了觸摸還是觸摸,但為了能徹底解放我們的雙手,就需要新的一種交互方式,智能語音。
提到智能語音就不得不提到人工智能,有智能語音的加持,所有的智能設(shè)備才可以變得真的只能。智能設(shè)備首先就是要先從聽得懂人話開始。而智能語音可不是單純的聊天機(jī)器人,智能語音是通過及時對話完成交互,實(shí)現(xiàn)幫用戶解決問題甚至提出一些合理的建議。
說起手機(jī)語音助手方面就不得不提蘋果的Siri和谷歌的Google Now。
蘋果Siri
Siri成立于2007年,2010年被蘋果以2億美金收購,最初是以文字聊天服務(wù)為主,隨后通過與全球最大的語音識別廠商N(yùn)uance合作,Siri實(shí)現(xiàn)了語音識別功能。
Siri智能語音助手
每年蘋果都會在iOS系統(tǒng)更新上花大力氣優(yōu)化Siri,一句“Hi Siri”就可以完全激活Sir語音助手。其最大的特色,則是人機(jī)的互動方面,不僅有十分生動的對話接口,其針對用戶詢問所給予的回答,也不至于答非所問,有時候更是讓人有種心有靈犀的驚喜,例如使用者如果在說出、輸入的內(nèi)容包括了“喝了點(diǎn)”、“家”這些字(甚至不需要符合語法,相當(dāng)人性化。。。),Siri 則會判斷為喝醉酒、要回家,并自動建議是否要幫忙叫出租車。
Google Now
說完了蘋果那必須就要來說說他的對手Google,Google Now是在谷歌I/O大會上隨安卓4.1系統(tǒng)同時推出的一款應(yīng)用,作為一款語音助手,它會全面了解用戶的各種習(xí)慣和正在進(jìn)行的動作,并向用戶提供相關(guān)信息。
Google Now
相比于Siri作為最早發(fā)布的個人智能語音助理產(chǎn)品,Siri必定會遇到強(qiáng)有力的競爭對手,被超越也屬正常情況。Google Now優(yōu)于Siri的一個先天優(yōu)勢在于與Google搜索功能的結(jié)合,用戶搜索的關(guān)鍵詞被記錄下來,Google Now智能化讀取關(guān)鍵詞后,為用戶提供相關(guān)的語音服務(wù)。除了處理速度快之外,Google Now針對用戶需求“主動”為用戶發(fā)出提醒,而不僅僅是回答用戶的提問,產(chǎn)品性能更為人性化。
但是作為中國用戶,在中文語境下兩款的語音體驗(yàn)都不盡如人意,Siri的語音識別率不高,稍微有點(diǎn)方言就聽不懂,但是人工智能做的比較好,調(diào)戲Siri已經(jīng)它存在的意義,不過搜索引擎夠強(qiáng)大。
網(wǎng)友調(diào)戲Siri(圖片來自微博)
Google Now語音識別率很高,但Google Now不像Siri那樣有人情味,比較呆滯死板,不能調(diào)戲。還一個重要的一點(diǎn),在中國我們壓根就用不了谷歌的任何服務(wù),而且就算可以用還需要將手機(jī)界面設(shè)置成英語。
中文語音助手不雞肋
話說我們中國語言博大精深,一句話可以就可以有多重含義。
“夏天能穿多少穿多少,冬天能穿多少穿多少”。
有時候我們不得不佩服老祖宗,能把這么復(fù)雜的語言傳承下來實(shí)屬不易。在語音識別方面谷歌和蘋果甚至微軟都很難做到準(zhǔn)確識別中文,明明識別非常好,可到了中文模式下本是智能的語音助手卻變成了智障語音。
在中文語境里做的比較好的不得不提一下訊飛,筆者知道訊飛做智能語音應(yīng)該還是說因?yàn)殄N子的堅(jiān)果Pro上的閃念膠囊,孤陋寡聞的我以前并不是很看好語音輸入和語音識別。但在堅(jiān)果Pro上看到了訊飛語音輸入后才徹底改變了我對這一事物的看法。
隨堅(jiān)果Pro推出的閃念膠囊(圖片來自網(wǎng)絡(luò))
拋開錘子的閃念膠囊,訊飛可以讓中文語音輸入做到如此高的準(zhǔn)確率實(shí)屬難得,而訊飛推出的靈犀語音助手也針對中文口音問題進(jìn)行了識別優(yōu)化。目前在國內(nèi)成為了代替Google Now的語音助手。
智能語音是強(qiáng)智能還是弱智能?
弱智能,直接開門見山的給出我的答案。目前來看,智能語音助手還處于很基礎(chǔ)的階段,除了可以滿足用戶的查看天氣預(yù)報和定鬧鐘以外很難想象得到能有別的什么用。英文語境下的智能程度多少要比中文高,其中的原因我分析有兩個。
第一是受語言環(huán)境所致,上面也闡述到了,中文的語言表述非常復(fù)雜,復(fù)雜程度可以說就連我們自己有時候都聽不明白,一句話可以有好幾種表達(dá)方法。再加之中國的方言千變?nèi)f化,就算是普通話還會分南區(qū)北區(qū)江浙區(qū)之分。
“劉奶奶找牛奶奶買榴蓮牛奶,牛奶奶給劉奶奶拿榴蓮牛奶”這句話讓NL不分的南方同學(xué)念出來估計(jì)要難為死了。
第二個原因則是大部分掌握智能語音核心技術(shù)的都是國外公司,國外公司不愿意將主要心思放在中國,而我們國內(nèi)的智能語音研發(fā)公司又比較稀缺,使得國內(nèi)的智能語音使用率偏低。
不過隨著人工智能浪潮的來襲,我們會更加的急需智能語音助手的幫助。在智能家居如果連人話都聽不懂只是簡單靠兩三個APP支持那還叫什么智能?在智能汽車中,如果汽車連我要去大柵(shi)欄還是大柵(zha)欄都聽不懂還怎么導(dǎo)航?
終極交互方式聯(lián)想(純屬聯(lián)想 只為娛樂)
智能語音交互可以說是目前最靠譜的未來暢想,而人類的鉆研和進(jìn)步是永無止境的,此時我們每天用的叫手機(jī),那今后隨著技術(shù)的不斷更新,手機(jī)或許也就不叫手機(jī)了。
眼球交互
早在若干年以前,三星就在Note3上搭載過眼球翻頁的技術(shù),也算得上是當(dāng)時一項(xiàng)黑科技的存在,但不知道因?yàn)榉摃r過于尷尬所以才取消這技術(shù)。試想一下如果這項(xiàng)技術(shù)在今后可以實(shí)現(xiàn),那么應(yīng)該會極大程度上避免斗雞眼的發(fā)病率。
全息投影
手掌投影操作(圖片來自網(wǎng)絡(luò))
手腕上可以帶上一種全息投影裝置,隨用隨打開,但終究還是靠手指來進(jìn)行交互操作,所以只能說是在設(shè)備上進(jìn)行了創(chuàng)新。不過倒是對練練左手很有幫助。
意念交互
意念控制(圖片來自網(wǎng)絡(luò))
使用意念來控制設(shè)備應(yīng)該是人類的最終極狀態(tài),每個人腦中都可以植入一顆電子芯片,通過思想來控制智能設(shè)備。開車時用意念控制車輛的行駛,通話時只需要用意念控制通訊設(shè)備撥打電話。到那時人類才算是徹底解放了雙手。
寫在最后
當(dāng)智能語音剛剛出現(xiàn)在手機(jī)當(dāng)中時,它只是作為了一款輔助工具來使用,更多的只是完成一些很機(jī)械式的工作。但隨著智能家居和智能移動設(shè)備的智能化,手機(jī)將肯定還是會作為一個智能中樞,來起到與智能設(shè)備聯(lián)動的作用。
筆者認(rèn)為只有智能語音的加強(qiáng)才可以讓設(shè)備聽懂我們需要什么。雖然目前來說智能語音只是扮演一個助手角色,而作為設(shè)備聯(lián)動中樞的手機(jī),首先是要先聽懂。所以今后手機(jī)交互的將來,最可能實(shí)現(xiàn)的就是讓語音助手變成“語音主手”。
不知大家有什么意見呢?可以隨時留言與筆者溝通。