本報實習(xí)記者 吳曉芳
LG推出類蘋果Siri韓文語音助手服務(wù)“Quick Voice”,谷歌推出Android語音服務(wù)Robin應(yīng)對蘋果的車用導(dǎo)航語音服務(wù)Siri,百度移動發(fā)展部總監(jiān)岳國峰此前也透露,百度今年晚些時候?qū)⑼瞥鲱愃芐iri的應(yīng)用……蘋果Siri的推出引發(fā)了一場消費終端產(chǎn)品語音控制熱潮,各大廠商競相推出類Siri語音應(yīng)用,帶來了智能語音市場的新一輪競爭。
時下語音應(yīng)用頗為火熱,但仍面臨不少問題:存在技術(shù)壁壘,智能化程度不夠高,經(jīng)常出現(xiàn)語音和語義上的歧義,無法達(dá)到理想的人機(jī)交互效果;語音應(yīng)用還需要根據(jù)本土文化和語言特色等進(jìn)行開發(fā)。此外,用戶認(rèn)知度有待進(jìn)一步挖掘。
搶市場先機(jī),廠商競推類Siri語音應(yīng)用
蘋果Siri的出現(xiàn)讓越來越多的用戶關(guān)注智能語音應(yīng)用,各廠商為了搶占市場先機(jī),紛紛競相推出類Siri語音應(yīng)用,智能語音市場一時間好不熱鬧。
LG推出類Siri韓文語音助手服務(wù)。據(jù)媒體報道,韓國電子巨頭LG公司日前推出了類似蘋果Siri的語音助手服務(wù)“Quick Voice”(目前尚無官方英文名稱,而是從韓文意譯而來),它將登陸LG的Optimus系列手機(jī),供用戶通過語音指令進(jìn)行搜索、導(dǎo)航、日程管理等操作,支持包括電話、電子郵件、通訊錄、鬧鐘、日歷在內(nèi)的11個應(yīng)用程序。同時,LG還和多家餐館等本地商戶建立了合作,當(dāng)用戶需要某一飯店的地址、聯(lián)系方式以及優(yōu)惠券時,只需要通過語音即可獲得。因為Siri目前尚不支持韓文,LG此舉顯然意在趕在蘋果新一代移動操作系統(tǒng)iOS 6推出前搶占韓國市場。
Robin登陸谷歌Android平臺。近日,一款名為Robin的語音助手登陸谷歌Android應(yīng)用商店Google Play。據(jù)悉,Robin專注于汽車導(dǎo)航服務(wù),主要為司機(jī)提供方向?qū)Ш、地點查詢、實時停車位置、交通信息、油價、天氣的信息查詢以及各種本地化服務(wù),并擁有語音和手勢操作界面,輸入語音便可得到語音輸入指示,而且能夠保障對話自然且流暢地進(jìn)行,能夠追蹤對話中的隱含語境。此外,它也將充當(dāng)起個性化收音機(jī)的角色,通過搜集分析大量信息,Robin可以敘述個人Twitter新聞或根據(jù)個人的喜好講笑話。就此,美國科技博客表示,“Android的Robin讓蘋果Siri面臨激烈競爭!
百度年底或推類Siri語音應(yīng)用。國內(nèi)搜索引擎巨頭百度在語音應(yīng)用領(lǐng)域也不甘示弱,百度移動發(fā)展部總監(jiān)岳國峰此前透露,百度已招聘大量研發(fā)人員對平臺進(jìn)行功能擴(kuò)展,今年晚些時候會推出類Siri應(yīng)用,即語音搜索和語音輸入。
前景廣闊,智能語音應(yīng)用引發(fā)新終端控制熱潮
Siri是蘋果公司在其產(chǎn)品iPhone 4S上內(nèi)置的一項語音控制功能,用戶可通過語音控制進(jìn)行手機(jī)讀短信、介紹餐廳、詢問天氣、語音設(shè)置鬧鐘等。Siri可以支持自然語言輸入,并且可以調(diào)用系統(tǒng)自帶的天氣預(yù)報、日程安排、搜索資料等應(yīng)用。此外,它還能夠不斷學(xué)習(xí)新的聲音和語調(diào),提供對話式的應(yīng)答。據(jù)了解,目前Siri共支持四種語音,即英文、法文、德文和日文。
類Siri則是對目前市場上出現(xiàn)的各種移動設(shè)備的語音識別系統(tǒng)的統(tǒng)稱。蘋果在中國有著龐大消費市場,但Siri卻不支持中文。對此,一家國外媒體表示,對于語音識別來說,中文極具挑戰(zhàn)性,因為普通話只有400個單音節(jié)聲音,根據(jù)聲調(diào)予以區(qū)別,而且中國還擁有很多種方言和數(shù)不盡的地方口音,這或許是Siri中文版遲遲未推出的主要原因。當(dāng)前,面對市場和客戶與日俱增的語音應(yīng)用需求,國際巨頭蘋果的劣勢,對國內(nèi)創(chuàng)業(yè)企業(yè)而言卻是機(jī)遇。中國語音市場醞釀已久的大規(guī)模語音應(yīng)用時機(jī)愈加成熟,因而出現(xiàn)了蟲洞、語點、智能360、Ciriis等中文版語音助手。
相對來說,中文版類Siri注重語音的本土化。在中文版語音助手中,以智能360這款應(yīng)用的“機(jī)器人的聲音”設(shè)置為例,單是機(jī)器人的聲音就有12中語音可供選擇,除了傳統(tǒng)意義上的男女普通話和男女童及老人普通話之外,其中還包括臺灣普通話、女生東北話、男聲河南話和女聲陜西話等多種帶有地方特色方言的各式普通話可供選擇。同類中,蟲洞在這方面也表現(xiàn)優(yōu)異,它給提供的語音選擇多達(dá)18種,也很精準(zhǔn)的抓住了各個地方的發(fā)音技巧和規(guī)律。
語音識別提高了移動設(shè)備的實用性和功能性,發(fā)展前景十分廣闊。時下市場上,已經(jīng)有許多移動設(shè)備使用了語音識別技術(shù)。在移動商業(yè)應(yīng)用中使用語音識別,用戶就可以通過語音特征實行導(dǎo)航和搜索功能。例如,將語音整合到應(yīng)用軟件中能為那些經(jīng)常邊開車邊收發(fā)短信和電子郵件的駕駛者服務(wù),使他們在駕車的同時能稍稍分心做些其他的事。
智能化程度不夠高,語音應(yīng)用需突破技術(shù)壁壘
盡管國內(nèi)智能語音應(yīng)用日漸火熱,但仍面臨不少問題。
其一,存在技術(shù)壁壘,智能化程度不夠高。據(jù)了解,目前市面上出現(xiàn)的類Siri語音助手還無法回答用戶的每一個問題。對于一些關(guān)于日常的衣食住行或是相對簡單的問題,這些語音助手基本上都能夠給予相對明確的答復(fù),但是對于一些稍微復(fù)雜的問題,通常給出的答案都是模凌兩可或干脆打起了“太極”。還是以智能360和蟲洞為例子,問“你有男朋友嗎?”智能360給出的回答是“努力工作”;而蟲洞給出的回答則顯得很應(yīng)景,“男朋友?我說有的,至于你信不信,反正我是不信。”對于“美國為什么攻打伊拉克?”這樣的問題,蟲洞則顯得有些裝傻賣萌:“不懂!嗚嗚嗚,我懷疑你是故意欺負(fù)我,我準(zhǔn)備告訴我媽媽!
其二,語音控制技術(shù)依然有較大的屏障,經(jīng)常出現(xiàn)語音和語義上的歧義,無法達(dá)到理想的人機(jī)交互效果。這些Siri的效仿者普遍面臨一個共同問題,它通常能聽得懂你在說什么,卻不理解你在說什么。換言之,其實就是它能夠識別到人的語音功能,卻無法準(zhǔn)確地詮釋語義的含義,這讓很多用戶在用的時候經(jīng)常出現(xiàn)“所問非所答”的令人啼笑皆非的情景。
其三,語音應(yīng)用還需根據(jù)本土文化和語言特色等進(jìn)行開發(fā)。要想達(dá)到理想的人機(jī)互動效果,語音和語義的有機(jī)完美結(jié)合才能避免出現(xiàn)答非所問的尷尬,而這就需要根據(jù)本土文化和語言特色等方面對語音應(yīng)用進(jìn)行開發(fā)。同時,用戶的使用和認(rèn)知也有待進(jìn)一步挖掘。