國產(chǎn)類Siri應(yīng)用層出不窮 語音識別開智控新時代

  本報記者 方茜

  隨著3G時代的到來,隨著科技快速發(fā)展,智能化、人性化已成為發(fā)展趨勢。蘋果Siri的推出引發(fā)國內(nèi)市場的熱潮,帶火了消費(fèi)端產(chǎn)品語音控制的概念,在成功地吸引了高關(guān)注度的同時,也帶來了智能語音市場新一輪的效仿與競爭。近日,貴州大學(xué)的9名法學(xué)生研發(fā)的一款號稱“中文版的Siri”的國產(chǎn)語音助手Airi就在網(wǎng)絡(luò)上紅火了一把。Airi不僅能聽、會說,可以幽默對話,而且Airi支持中文。智能手機(jī)“又能聽又會說”功能,徹底改變了人與手機(jī)之間的交互方式,使人與手機(jī)之間的“溝通”變得更加自然方便,這將為手機(jī)行業(yè)帶來巨大變化。

  Siri讓語音控制手機(jī)成為現(xiàn)實(shí)

  蘋果Siri的流行帶火了消費(fèi)端產(chǎn)品語音控制的概念,更是革新了語音識別的定義。蘋果Siri之所以讓大眾喜愛,并不是它僅僅使用語音功能,而是將語音與手機(jī)的各種應(yīng)用完美結(jié)合。

  2011年10月,蘋果發(fā)布了Siri,它通過語音大大簡化了手機(jī)操作,使iPhone 4S變身為一臺智能機(jī)器人助手;赟iri的語音系統(tǒng)成了iPhone4S創(chuàng)新性的突破,Siri功能可以讓手機(jī)用戶通過語音來對手機(jī)進(jìn)行操控,發(fā)送短信、撥打電話等功能都可以通過語音指令實(shí)現(xiàn)。

  Siri這種超越語音輸入法意義之上的語義識別工具,其準(zhǔn)確度和服務(wù)質(zhì)量取決于和使用者的磨合程度——使用的時間越長,Siri后臺捕捉到的用戶個性化偏好就越多,也就意味著Siri“私人助理”的價值是和使用時間成正比。

  不過語音識別并不是什么革命性技術(shù),早在多年前,IBM的語音識別軟件在PC上就有不錯的識別率。近年來,Google、微軟包括國內(nèi)的一些公司也投入了大量研發(fā),形成了一些相當(dāng)成熟產(chǎn)品。

  在最近的CES展會上,各個地方都可以看到語音指令和語音聽寫的早期領(lǐng)先者Nuance的身影。Nuance是支持Dragon語音識別軟件產(chǎn)品線的公司,蘋果的Siri軟件也使用該公司的聽寫技術(shù)。英特爾也在近期宣布與Nuance合作,將把語音指令技術(shù)應(yīng)用到筆記本電腦。

  Siri引發(fā)國內(nèi)語音產(chǎn)品開發(fā)熱潮

  早在2000年,比爾·蓋茨就曾提出“未來10年是語音的時代”。蘋果Siri的推出引發(fā)了國內(nèi)市場的熱潮,帶來極大的關(guān)注度,也帶來智能手機(jī)市場上,新一輪的戰(zhàn)爭。

  盡管國內(nèi)目前的語音應(yīng)用制作尚未成熟,不過從各大終端廠商爭推智能語音服務(wù)的動作來看,中文語音市場卻已開始暗流洶涌。去年12月26日,UC瀏覽器語音公測版發(fā)布,使UC瀏覽器成為全球首個使用語音智能控制的手機(jī)瀏覽器。同樣是去年12月份,騰訊推出了支持語音搜索功能的S60V5手機(jī)QQ瀏覽器2.7版,這次無疑是又一力作。

  國內(nèi)知名的瀏覽器廠商UC優(yōu)視,當(dāng)時推出了其最新的UC瀏覽器8.2 Android版,并且率先在手機(jī)瀏覽器中加入了語音助理功能,實(shí)現(xiàn)了語音控制與語音搜索。

  騰訊日前發(fā)布的全面智能語音控制手機(jī)瀏覽器可以通過語音進(jìn)行多項(xiàng)智能操控,使用普通話就可以直接打開各大網(wǎng)站,獲取搜索結(jié)果,并且還支持通過語音調(diào)出“書簽”、“歷史”、“添加書簽”、“設(shè)置”、“退出”等一系列手機(jī)瀏覽器的常用操作。據(jù)騰訊手機(jī)QQ瀏覽器相關(guān)負(fù)責(zé)人介紹,除了手機(jī)瀏覽器,騰訊自主研發(fā)的“智能語音識別技術(shù)”還被用于手機(jī)SOSO地圖、手機(jī)SOSO客戶端等多個產(chǎn)品中。此外Airi、Ciriis等國產(chǎn)中文語音應(yīng)用目前也已悄然搶灘中國市場。

  艾媒咨詢分析師表示,隨著消費(fèi)者對語音技術(shù)認(rèn)識的加深,這個行業(yè)正在迎來蓬勃發(fā)展的時間窗口。

  語音操控應(yīng)用全面普及尚需時日

  蘋果Siri的流行帶火了消費(fèi)端產(chǎn)品語音控制的概念。在美國拉斯維加斯舉行的國際消費(fèi)電子產(chǎn)品展會上,從汽車到電視,幾乎各類產(chǎn)品都整合了語音控制功能。隨著設(shè)備具有語音和手勢功能,汽車將成為這種設(shè)備。在CES展會上,奧迪展示了為其汽車提供的新的手勢驅(qū)動的界面。奔馳介紹了一直名為DICE(動態(tài)和直觀控制體驗(yàn))的新的集成的沖擊系統(tǒng)。未來語音控制功能還會應(yīng)用到從電視到安防等幾乎各類產(chǎn)品。

  消費(fèi)者在體驗(yàn)手機(jī)的同時,在手機(jī)中加入語音控制系統(tǒng),滿足了消費(fèi)者使用上新鮮感,但也存在一些問題。首先,語音服務(wù)功能本身仍存在著技術(shù)改進(jìn)。雖然語音控制技術(shù)多年前就已現(xiàn)身,但語音識別的精確度仍有待提高,就如蘋果Siri在語音識別上也尚待完善。從語音識別到執(zhí)行聲控命令,這是一個極其復(fù)雜的過程,出錯率較高。

  其次,通過聲音來控制電子設(shè)備,似乎面對強(qiáng)大的阻力,很難成為主流。由于人們在不同的場所使用操作電子設(shè)備,因此聲音的公開性,天然限制了語音識別應(yīng)用的場景和環(huán)境,給語言識別帶來了一定的限制。

  因此,隨著消費(fèi)者對語音技術(shù)認(rèn)識的加深,相信在未來發(fā)展過程中,廠商仍應(yīng)加強(qiáng)語音操控功能的技術(shù)完善。另外,廠商還應(yīng)提升用戶的綜合體驗(yàn),給用戶帶來新鮮瀏覽體驗(yàn)的產(chǎn)品,以便滿足多樣化的用戶需求,贏得更多消費(fèi)者,從而或鞏固、或進(jìn)攻市場。

  智能語音應(yīng)用真正意義上拉近了終端與消費(fèi)者的距離,實(shí)現(xiàn)終端智能化的歷史性的跨越。未來必將開辟智能控制新時代。


微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號,免費(fèi)領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費(fèi)領(lǐng)取《中國移動:5G網(wǎng)絡(luò)AI應(yīng)用典型場景技術(shù)解決方案白皮書
  • 2、回復(fù)“5G6G”免費(fèi)領(lǐng)取《5G_6G毫米波測試技術(shù)白皮書-2022_03-21
  • 3、回復(fù)“YD6G”免費(fèi)領(lǐng)取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復(fù)“LTBPS”免費(fèi)領(lǐng)取《《中國聯(lián)通5G終端白皮書》
  • 5、回復(fù)“ZGDX”免費(fèi)領(lǐng)取《中國電信5GNTN技術(shù)白皮書
  • 6、回復(fù)“TXSB”免費(fèi)領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費(fèi)領(lǐng)取《中國移動算力并網(wǎng)白皮書
  • 8、回復(fù)“5GX3”免費(fèi)領(lǐng)取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點(diǎn)本月熱點(diǎn)

     

      最熱通信招聘

    業(yè)界最新資訊


      最新招聘信息