國內(nèi)廠商試水語音控制 尚無法與Siri比肩

相關專題: 人工智能 中國移動

  經(jīng)典科幻電影《A.I。》(人工智能)展示了 高度發(fā)達,并且能感知情感的機械人科技。

  國內(nèi)不少手機軟件廠商都跟隨熱潮推出智能語音服務,至于實際應用如何,有待檢驗。

  如今機械人的智能性越來越高,未來能代替人類工作亦不足為奇。

  用語音來操縱機器——這不只是流傳多年的魔術(shù),正在成為一門成熟的實用技術(shù)。蘋果公司在喬布斯過世前夜展示的iPhone 4S應用Siri,讓語音操控變成了一個想象力激蕩的熱點。

  隨蘋果iPhone 4S一同露臉的語音服務Siri攪熱了語音控制、人工智能應用市場,國內(nèi)廠商也紛紛試水類似應用,欲與Siri掰掰手腕。日前,據(jù)記者了解,國內(nèi)最大的手機瀏覽器公司UC優(yōu)視正在秘密研發(fā)一款完全由語音控制的瀏覽器。廣東國筆發(fā)明的Winguo(問果)語言智能系統(tǒng),也在2011年中國移動全球開發(fā)者大會上亮相。不過,盡管各廠商都投入重兵研發(fā)語音控制技術(shù),也推出相關應用,但與Siri相比仍不是一個等量級。這些應用想媲美Siri,仍需繼續(xù)努力。文、圖整理/記者 馮秋瑜、李光焱

  手機:刮起智能語音熱

  據(jù)悉,UC優(yōu)視頻正在內(nèi)部秘密研發(fā)和測試一款完全由語音控制的瀏覽器。盡管啟動畫面顯示跟UC剛剛發(fā)布的8.2BETA版一模一樣,但是打開之后會發(fā)現(xiàn)所有網(wǎng)頁的輸入欄都有一個麥克風標志。盡管Google之前已經(jīng)提供了網(wǎng)頁版的語音搜索,但可以使用語音對功能進行控制、搜索和全局輸入的瀏覽器,這應該是全球第一個。

  據(jù)知情人士透露,UC這個在研發(fā)中的語音瀏覽器語音識別相當準確,“比想象中的好”,不僅可以控制UC瀏覽器的操作,比如打開書簽、開啟夜間模式、當前打開頁面前進后退。

  “相信騰訊也在努力研發(fā)語音控制的手機瀏覽器!庇袠I(yè)內(nèi)人士稱。

  與語音控制的智能方式不同,一款由廣東公司研發(fā)的手機桌面搜索系統(tǒng)也很神奇:在手機桌面直接就寫“天氣”,桌面即刻顯示當時廣州市的氣溫、濕度、風速等等,圖文并茂,清晰明了;寫一段話,點擊分享即可發(fā)email、微博、短信等等,非常便捷快速,更新穎的是桌面干凈如白紙,視覺感受特別舒服。

  除此之外,聯(lián)想也在S2中應用了語音控制系統(tǒng),該系統(tǒng)可以實現(xiàn)語音識別輸入,并能把輸入的內(nèi)容用在微博、短信、導航等多個應用程序當中。

  電視:眼、口并用 解放你雙手

  目前“電視機+機頂盒”這種傳統(tǒng)的、復雜的遙控器已成為制約電視機向智能化、多功能化發(fā)展的重要阻礙,電視機的人機界面必須到了革新的時候了。專家認為,未來智能電視的挑戰(zhàn),在于解決人機互動的良好體驗,2012年電視“玩”語音互動會是一種時尚。到時候,你完全可以窩在沙發(fā)上懶懶地對著屏幕說:“給我換個臺!”或者“音量調(diào)大點”,然后電視機就自動為你換臺、調(diào)音量,連按遙控器的力氣都省了。

  日前,運用語音識別、漢語語音分析、數(shù)字聲音信號處理、語音編碼、說話人自動適應、回聲消除、抗干擾及消噪聲七大高新技術(shù)的智能聲控電視已經(jīng)研制成功,用戶只需把自己的聲音及指令預先輸入系統(tǒng),聲控電視就會對他們“言聽計從”,最多能辨認12種聲音,語音識別準確率達99%以上。

  車載智能:

  地圖、天氣查詢很方便

  縱然意義深遠,但只能英語對話的Siri卻未能帶給國人太多的體會,更多的樂趣只能停留在網(wǎng)絡視頻。車載語音交互系統(tǒng)iVoka是一個基于“語音云”的服務,通過車載的3G網(wǎng)絡,iVoka可以實時與“云中數(shù)據(jù)”進行交互。從地圖導航、查天氣到打電話、發(fā)短信,iVoka完成得都不錯。iVoka將在明年1月交付用戶內(nèi)測,最快明年2月便可以正式裝載更多的車型。

  其實,早在多年以前,許多豪華汽車便能夠通過語音來進行控制,不過,這些控制僅限定于規(guī)定的語句,距離真正意義上的人車“對話”還有很長一段距離。iVoka提供的語音服務不僅囊括了行車資訊、生活查詢、娛樂互動,甚至可以和車進行語音個性對話。而且所有操作均可以使用語音操控完成,不用再去觸控觸摸屏,在一定程度上降低了事故發(fā)生的概率。

  最有趣的是與iVoka的語音交談。喊出“我們聊聊吧”,iVoka系統(tǒng)就會出來“好的,聊點什么呢?”,嘗試問iVoka“你今年多大?”她竟然俏皮地回答“下次告訴你”;如果你夸她一句“你真聰明”,她也會謙虛地回答“我思,故我在”。

  記者觀察:

  語音控制還無法與Siri比肩

  盡管國內(nèi)多個應用都被拿來與蘋果Siri相比,但它們和Siri還完全不是一個級別的產(chǎn)品。即便是谷歌Android系統(tǒng)的Voice Actions,提供了非常堅實可靠的聲音識別引擎,高識別度令人稱奇。不過,和中國版Siri系統(tǒng)相似,要求你說話要具備嚴格的語法結(jié)構(gòu)和格式,否則無法識別。

  Siri則完全不同,與之對話你可以拋棄繁瑣的語法結(jié)構(gòu),Siri會結(jié)合上下文結(jié)構(gòu)去理解,它還會從人類語言史的角度出發(fā),利用人工智能去分析,并在絕大多數(shù)情況下領會你的意思。更加人性化的是,一旦你開始和Siri進入一段對話,它甚至能理解許多含義模糊或者引申的語義。

  但中國版Siri做不到這樣的事情,因為它只是一個聲控命令軟件,而并非人工智能。 “要知道Siri前端使用了語音識別以及語音合成技術(shù)。重點在后臺,集成了網(wǎng)頁搜索、知識計算、資料庫、問答推薦等各種技術(shù),最終才表現(xiàn)為Siri,而中國版Siri,還只做了前端,后端則比較缺乏!笔謾C業(yè)資深人士海東稱。


微信掃描分享本文到朋友圈
掃碼關注5G通信官方公眾號,免費領取以下5G精品資料
  • 1、回復“YD5GAI”免費領取《中國移動:5G網(wǎng)絡AI應用典型場景技術(shù)解決方案白皮書
  • 2、回復“5G6G”免費領取《5G_6G毫米波測試技術(shù)白皮書-2022_03-21
  • 3、回復“YD6G”免費領取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復“LTBPS”免費領取《《中國聯(lián)通5G終端白皮書》
  • 5、回復“ZGDX”免費領取《中國電信5GNTN技術(shù)白皮書
  • 6、回復“TXSB”免費領取《通信設備安裝工程施工工藝圖解
  • 7、回復“YDSL”免費領取《中國移動算力并網(wǎng)白皮書
  • 8、回復“5GX3”免費領取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息