Siri首次支持中文 語音應(yīng)用智能化程度尚需提高

相關(guān)專題: 人工智能

  本報記者 趙越

  iPhone 4S的推出本身并沒有給廣大的果粉帶來更多的驚艷,反而嵌入iPhone 4S的一款名叫Siri的語音控制應(yīng)用由于其創(chuàng)新的實現(xiàn)了類人機交互,令iPhone 4S變身為一臺智能化機器人,使該款語音控制應(yīng)用程序成為了iPhone 4S最為成功的賣點。但Siri目前只支持四種語言,對于Siri的傳說和猜想風(fēng)生四起,從未間斷。如今,隨著iPhone 5以及iOS 6系統(tǒng)的正式發(fā)布,該款智能語音應(yīng)用程序Siri也將支持中文,終于能夠進入中國市場,與國人見面。這勢必會掀起新一輪“調(diào)戲”風(fēng)潮,同時也將促進國內(nèi)的類Siri語音控制應(yīng)用更加流行。

  語音助手Siri 成最熱應(yīng)用,今秋將支持中文

  Siri成立于2007年,原是一個第三方應(yīng)用,能夠在App Store 上輕松的找到,自2010年被蘋果以2億美金收購,Siri 正式從App Store下架,成為了iPhone 4S的主打產(chǎn)品。最初Siri的設(shè)計只局限于以文字聊天服務(wù)為主,隨后通過與全球最大的語音識別廠商Nuance合作,從而幫助Siri實現(xiàn)了語音識別功能。

  Siri可以通過iPhone讀短信、介紹餐廳、詢問天氣、語音設(shè)置鬧鐘等,支持自然語言輸入,使用者可以通過聲控、文字輸入的方式,除了可調(diào)用系統(tǒng)自帶的天氣預(yù)報、日程安排、搜索資料等應(yīng)用,還可以搜尋餐廳、電影院等生活信息,同時也可以直接收看各項相關(guān)評論,甚至是直接訂位、訂票。

  由于Siri具有高度的人工智能能力,在很大程度上方便了使用者,可謂是iPhone 4S推出的最為成功的應(yīng)用程序之一,受到了業(yè)界內(nèi)外的關(guān)注和高度評價。市場研究機構(gòu)ChangeWave在去年11月調(diào)查北美蘋果iPhone 4S用戶后發(fā)現(xiàn),高達49%的用戶表示Siri是他們最喜愛的iPhone 4S功能。

  在iPhone 4S上,Siri暫無中文支持,因此,國內(nèi)的用戶對于Siri這款應(yīng)用神器來說,仍處在水中看月的階段。而Siri在iPhone 4S上的成功,使蘋果公司有信心將其服務(wù)范圍擴大。

  在今秋蘋果iOS 6系統(tǒng)正式發(fā)布,Siri也將成為新系統(tǒng)的嵌入程序,其服務(wù)范圍聚焦在體育、電影和餐廳3個領(lǐng)域,并將支持的語言種類擴大,其中就包括對中文的支持,包括漢語普通話及粵語。這必然又會掀起新一輪語音智能交互程序的熱潮。

  智能語音市場前景大好,廠商競推類Siri應(yīng)用

  蘋果宣布推出Siri之后,“智能語音”這個代名詞似乎一下紅遍了全球。各大廠商都相繼推出了自己的智能語音產(chǎn)品,現(xiàn)在已經(jīng)有越來越多的人通過語音功能來操控手機。

  目前在市場上出現(xiàn)的類Siri的語音助手種類繁多。在國外市場上,被業(yè)界認為是Siri最大競爭者的類似應(yīng)用,應(yīng)屬谷歌在I/O開發(fā)者大會上隨安卓4.1系統(tǒng)同時推出的一款名為Google Now的語音助手應(yīng)用,它會全面了解你的各種習(xí)慣和正在進行的動作,并主動為用戶推送有價值的相關(guān)信息。

  與Siri相比,Google Now提供的信息相關(guān)性更高,幾乎是瞬間返回答案。其推出被認為是Siri 的一種進化的搜索,因為它能夠更智能的回答用戶的問題而不是給出一堆鏈接。

  國內(nèi)互聯(lián)網(wǎng)巨頭百度前不久專門成立了一個語音功能研發(fā)部門,專門進行智能語音的研發(fā)。百度新開發(fā)出的產(chǎn)品是一款跟Siri類似的語音應(yīng)用,用戶同樣可以利用它查看地圖、天氣甚至搜索MP3等功能。而其最大的特色就是具有十分強悍的中文識別能力,擁有非常豐富的語音選擇,語音識別中文的能力要遠遠強于Siri。

  目前,本土的語音助手應(yīng)用在中文語音識別發(fā)展較為突出的還包括蟲洞和智能360等,蟲洞語音助手提供查找附近,軟件管理,備忘提醒,播放音樂,語音翻譯等日常生活服務(wù)。蟲洞助手還可以幫助打開手機的WiFi,藍牙等設(shè)置,控制手機的電量和屏幕亮度,也能進行備忘提醒,直接查找播放音樂等。智能360為一款移動智能語音交互應(yīng)用,分為手機操作指令、聊天解悶、生活服務(wù)、娛樂休閑四大模塊,并且目標為全部實現(xiàn)自然語言交互。在一定程度上讓國內(nèi)用戶體驗了類Siri的語音控制程序所帶來的便捷和娛樂,將語音整合到應(yīng)用軟件中,大大地解放了使用者雙手,切實提高了效率。

  本土化不夠深入,智能化程度有待提高

  由于移動智能設(shè)備手動輸入的弊端,語音識別技術(shù)在移動終端設(shè)備上的發(fā)展必將超越PC。相信隨著語音識別技術(shù)的進一步發(fā)展,形式多樣、用戶體驗豐富的基于語音識別技術(shù)的移動應(yīng)用將會出現(xiàn)在我們的眼前。

  但目前來看,已推出的語音助手應(yīng)用或多或少存在問題,對于智能化程度較高的Siri來說,其本土化程度不夠深入。最新發(fā)布的iOS 6系統(tǒng)中雖然集成了新浪微博、高德地圖等中國本地服務(wù),但是跟普通用戶密切相關(guān)的消費類服務(wù)產(chǎn)品,在Siri中集成的并不多。

  比如,在最常用的餐館查詢上,Siri目前的數(shù)據(jù)還是來自美國Yelp,而并非中國的大眾點評或街旁等應(yīng)用。就中文Siri的表現(xiàn)來看,這種本地服務(wù)集成并沒有像美國那樣成熟。目前很多國內(nèi)的廠商都在積極接觸蘋果公司,希望服務(wù)能夠集成到蘋果Siri系統(tǒng)之中,逐步使中文Siri成為真正的服務(wù)到國人的產(chǎn)品。

  而對于目前國內(nèi)市面上存在的所有的類Siri語音助手,其最為突出的弊端仍是智能化程度不高,其面臨一個共同的問題是,它通常能聽得懂你在說什么,卻不理解你在說什么。對于一些關(guān)于日常的衣食住行或是相對簡單的問題,這些語音助手基本上都能夠給予相對明確的答復(fù),但是對于一些稍微復(fù)雜的問題,其回答并不盡人意。

  換言之,這類應(yīng)用還仍處于語音命令的階段,人工智能的程度還不夠高,無法準確的詮釋語義的深層含義,這就讓很多用戶在使用時常常會遇到答非所問的尷尬局面。因此,要想真正意義上達到理想的人機互動效果,實現(xiàn)人工智能的最終目標,語音和語義上的有機完美結(jié)合才是技術(shù)創(chuàng)新最終要完成的事情。


微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號,免費領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費領(lǐng)取《中國移動:5G網(wǎng)絡(luò)AI應(yīng)用典型場景技術(shù)解決方案白皮書
  • 2、回復(fù)“5G6G”免費領(lǐng)取《5G_6G毫米波測試技術(shù)白皮書-2022_03-21
  • 3、回復(fù)“YD6G”免費領(lǐng)取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復(fù)“LTBPS”免費領(lǐng)取《《中國聯(lián)通5G終端白皮書》
  • 5、回復(fù)“ZGDX”免費領(lǐng)取《中國電信5GNTN技術(shù)白皮書
  • 6、回復(fù)“TXSB”免費領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費領(lǐng)取《中國移動算力并網(wǎng)白皮書
  • 8、回復(fù)“5GX3”免費領(lǐng)取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息