百度、中興等國產(chǎn)廠商“抱團(tuán)”推手機(jī)聲控“5A標(biāo)準(zhǔn)”
“天河城附近哪家西餐廳比較好?”對著手機(jī),你可以像詢問秘書一樣。但這一次,回答你的不一定是蘋果Siri語音助手,而可能是“智慧語音聯(lián)盟”中的成員如中興的語音手機(jī)。
據(jù)了解,在剛結(jié)束的北京通信展上,中興通訊、Nuance、Audience、高德、百度、中國科學(xué)院自動化所等公司和機(jī)構(gòu)組成的“智慧語音聯(lián)盟”正式成立,同時行業(yè)首個智能語音技術(shù)規(guī)范標(biāo)準(zhǔn)“5A標(biāo)準(zhǔn)”也隨之正式出爐。這意味著,在蘋果、谷歌、微軟等巨頭扎堆布局智能語音服務(wù)市場后,國內(nèi)廠商亦抱團(tuán)迎戰(zhàn)。據(jù)悉,國內(nèi)語音技術(shù)將應(yīng)用于北斗衛(wèi)星的語音傳送。
文、圖整理/記者 李光焱
語音播報將飛上“云端”
“大家都知道中國的北斗定位系統(tǒng)一大優(yōu)勢是可以發(fā)短報文,很快它還能傳送語音。日前,作為‘智慧語音聯(lián)盟’的成員,中科院自動化研究所模式識別國家重點實驗室副主任陶建華教授透露,國內(nèi)語音技術(shù)已經(jīng)從實驗飛向云端。
“摩托羅拉時代手機(jī)是‘滿足我’,諾基亞時代手機(jī)是‘吸引我’,iPhone時代是‘改變我’,如今手機(jī)應(yīng)該進(jìn)入‘理解我’的時代,這就是聲控的時代。”作為“智慧語音聯(lián)盟”的發(fā)起方,中興通訊執(zhí)行副總裁、終端事業(yè)部CEO曾學(xué)忠對智能語音應(yīng)用頗為期待。
記者了解到,從蘋果手機(jī)搭載Siri語音助手開始,谷歌、微軟等都投身這一市場,個性化的語音技術(shù)解決方案開始被消費者所關(guān)注,成為目前移動智能終端上最炙手可熱的核心發(fā)展技術(shù)之一。不過,若論單打獨斗,國內(nèi)廠商顯然不是巨頭們的對手。
因此,該聯(lián)盟成立之初,就囊括了中外智能語音技術(shù)領(lǐng)域最權(quán)威的平臺技術(shù)方案供應(yīng)商、內(nèi)容提供商和終端制造商,力求從開始就最大限度地整合并共享全球行業(yè)領(lǐng)先的智慧語音技術(shù),引領(lǐng)智能終端從“觸控時代”邁向“聲控時代”。
“語音和圖片才是最自然的交互方式!贝饲,百度首席科學(xué)家吳恩達(dá)表示,在語音領(lǐng)域,百度已經(jīng)推出了四項相關(guān)產(chǎn)品,比如語音搜索、語音輸入法和地圖等。目前,語音搜索占搜索的10%,還遠(yuǎn)低于圖片搜索。
智能語音技術(shù)各自為戰(zhàn)
據(jù)悉,目前國內(nèi)語音技術(shù)廠商基本分為三類:一類是傳統(tǒng)語音技術(shù)廠商,包括像科大訊飛、捷通華聲等;第二類是互聯(lián)網(wǎng)廠商,包括百度、騰訊、搜狗等,普遍采用戰(zhàn)略合作或者收購等方式,掌握智能語音技術(shù),推廣語音服務(wù);第三類是創(chuàng)業(yè)企業(yè),如云知聲、思必馳等,它們專注于垂直行業(yè),比如汽車、家電,來推廣自己的語音技術(shù)和產(chǎn)品。
廠商縱橫交錯,標(biāo)準(zhǔn)并不統(tǒng)一。為此,“智慧語音聯(lián)盟”倡導(dǎo)共同打造“5A標(biāo)準(zhǔn)”,即倡導(dǎo)未來的智能語音解決方案需要具備個性化語音體驗(Anyone)、智能全操控(Anyhow)、全天候操作(Anytime)、千萬級數(shù)據(jù)本地存儲(Anything)以及全環(huán)境使用(Anywhere)這五大特征。
據(jù)了解,“5A標(biāo)準(zhǔn)”代表了目前語音技術(shù)行業(yè)最先進(jìn)的理念和最高研發(fā)水準(zhǔn),首次為業(yè)內(nèi)提供了智能語音終端可參考的標(biāo)準(zhǔn)性規(guī)范,將極大地促進(jìn)終端語音技術(shù)的發(fā)展以及消費者使用體驗的提升。
不過,據(jù)謝偉表示,“語音技術(shù)的國家標(biāo)準(zhǔn)規(guī)范仍是空白,無論是我們,還是科大訊飛發(fā)起的‘中國語音聯(lián)盟’,實際上都是民間企業(yè)在運作!
業(yè)內(nèi)人士稱,“智慧語音聯(lián)盟”和“中國語音聯(lián)盟”的成員會交叉,但遵循的技術(shù)框架并不同,未來二者很可能會爭奪“標(biāo)準(zhǔn)話語權(quán)”。記者了解到,自2012年8月1日,中國語音聯(lián)盟成立以來,科大訊飛不斷“開疆拓土”,力推語音搜索。
“聲控手機(jī)”未來不是夢
曾學(xué)忠告訴記者,隨著“智慧語音聯(lián)盟”的成立,中興手機(jī)正式將發(fā)展智慧語音技術(shù)提升至產(chǎn)品發(fā)展戰(zhàn)略層級,將展開一系列的戰(zhàn)略實施。未來中興的智慧語音戰(zhàn)略將從實用性出發(fā),打造觸屏之外的第二個輸入點,促使聲控在智能終端上做到比觸碰更便利,讓用戶從“手上做文章”轉(zhuǎn)變?yōu)椤白焐舷鹿Ψ颉薄?/p>
知名智能語音技術(shù)廠商Audience全球銷售副總裁暨大中華區(qū)總經(jīng)理Robert Schoenfield表示,該公司已經(jīng)和國內(nèi)十幾家品牌手機(jī)廠商展開語音方面的合作,并且和中國移動合作建立了相關(guān)的語音研究實驗室。并且,在海外市場和華為、中興的合作,讓公司看到了中國語音市場的機(jī)會,有些制造廠商的出貨量并不大,但是增長驚人。
“手機(jī)的聲控時代即將來臨!豹毩⒎治鋈耸繌堈槐硎荆瑖鴥(nèi)外一批廠商扎堆,尤其是投資、并購增多,是行業(yè)爆發(fā)的前兆。比如,亞馬遜就以2600萬美元收購類似于Siri的智能語音助手應(yīng)用Evi。
值得注意的是,聲控手機(jī)與蘋果的Siri、小i機(jī)器人等應(yīng)用不同。據(jù)謝偉表示,聲控手機(jī)的整個操作系統(tǒng)里面都語音化,而Siri之類只是一個應(yīng)用。同時,整個系統(tǒng)語音化,不光是喚醒應(yīng)用,很多地方都可以用到。
陶建華也認(rèn)為,聲控在安全手機(jī)上,會有更大的用武之地。因此,在指紋識別之后,聲音識別來保證和搜集安全,將會成為新寵。