MSCBSC 移動通信論壇
搜索
登錄注冊
網(wǎng)絡(luò)優(yōu)化工程師招聘專欄 4G/LTE通信工程師最新職位列表 通信實習(xí)生/應(yīng)屆生招聘職位

  • 閱讀:900
  • 回復(fù):0
自主思考 語音技術(shù)真能聽懂復(fù)雜命令?
mao_mao
論壇副管
鎵嬫満鍙風(fēng)爜宸查獙璇? style=


 發(fā)短消息    關(guān)注Ta 

C友·鐵桿勛章   管理·勤奮勛章   C友·進步勛章   管理·優(yōu)秀勛章   C友·貢獻勛章   “灌水之王”   紀(jì)念勛章·七周年   管理·標(biāo)兵勛章   活動·積極勛章   財富勛章·財運連連   財富勛章·大富豪   財富勛章·小財主   專家·終級勛章   財富勛章·神秘富豪   C友·登錄達人   紀(jì)念勛章·五周年   財富勛章·富可敵國   財富勛章·財神   財富勛章·富甲一方   財富勛章·鉆石王老五   活動·第二屆通信技術(shù)杯   紀(jì)念勛章·六周年   活動·攝影達人   紀(jì)念勛章·八周年   紀(jì)念勛章·九周年   紀(jì)念勛章·十周年   C友·技術(shù)大神  
積分 428896
帖子 85070
威望 5329805 個
禮品券 5423 個
專家指數(shù) 3546
注冊 2009-4-24
專業(yè)方向  移動通信
回答問題數(shù) 0
回答被采納數(shù) 0
回答采納率 0%
 
發(fā)表于 2016-08-10 14:32:20  只看樓主 

  語音助手極大的解放了人類的雙手,當(dāng)雙手雙眼被占用時,當(dāng)無法在鍵盤上輸入時,當(dāng)打字不方便時,只需說出你的指令,應(yīng)用便會自動進行下一步操作,就像請別人幫忙一樣方便。不過對待語音助手可不能像對待朋友那般隨意,你說出的指令要非常清晰,除了發(fā)音要字正腔圓之外,還要直接表達出指令的含義,這是由于語音助手不具備邏輯思考能力,它無法像人類一樣去“理解”,語音助手背后的語音技術(shù)就顯得尤為重要了。

  前一段時間,搜狗發(fā)布了“知 音”引擎,它是一種可以令人機交互更加自然的語音技術(shù),有了它的幫助手機上的語音助手,以及其它支持語音輸入功能的應(yīng)用可以理解邏輯更為復(fù)雜的指令,而不 再需要“慢慢說”,甚至當(dāng)你的指令有前后順序和層級關(guān)系時它也能聽懂,這就好比機器突然有了大腦一樣。

  糾錯

  其實當(dāng)前的語 音技術(shù)是有一定的糾錯能力的,比如使用語音輸入時,當(dāng)用戶說出某個詞語后應(yīng)用會通過發(fā)音來判斷是哪些文字,但在用戶說出全部內(nèi)容時,前面的某些詞語還會繼 續(xù)進行修正。不過一旦文字上屏就不能再次修改了,只能通過手動的方法刪除,麻煩不說,也失去了語音輸入的意義。

  搜狗輸入法中已經(jīng)接入了“知音”引擎,它具備理解糾錯指令的能力,如果用戶發(fā)現(xiàn)哪里輸入錯誤,可以通過語音的方式來修改。受到環(huán)境、口音、語速等影響,語音輸入時聽錯字是很正常的,通過實際測試來檢驗一下搜狗輸入法語音輸入的糾錯能力。

  全部指令如下:

  “今天晚上七點,我和他一起去大望路吃飯,那邊兒好停車”

  “女字旁的她”

  “把七點改為六點”

  “把大望路改成國貿(mào)”

  “叫上張爽一起去吧”

  “立早章”

  “刪掉那邊兒好停車”

  可以看到無論是輸入時還是后期糾錯,應(yīng)用所給出的結(jié)果是完全正確的,語音修改也變成了一件很簡單的操作。不僅如此,它還能夠聽懂用戶發(fā)出的糾錯指令并替換掉錯誤的內(nèi)容,解決了聽錯字的問題。

  據(jù)搜狗語音交互技術(shù)中心負責(zé)人王硯峰表示,搜狗語音可以支持的文法數(shù)目在3萬個以上,修改的成功率可達到80%,這些主要得益于豐富的詞庫數(shù)據(jù)、拆字庫、用戶輸入的語料以及大量的百科知識圖譜。而這些數(shù)據(jù)的來源除了語義系統(tǒng)架構(gòu)之外,還有搜狗旗下支持語音的產(chǎn)品。

  邏輯指令

  上文中提到,大多數(shù)語音指令只能采用“單線程處理”,也就是說一個指令只能對應(yīng)一項功能,且不同的指令之間不能有邏輯關(guān)系。但是搜狗“知音”引擎表示可 以做到。前面提到語音輸入多用于雙手不便打字的情況下,比如駕車時,語音導(dǎo)航是一個非常重要的助手。通常來說,使用語音導(dǎo)航時發(fā)出的指令邏輯性比較強,舉 個例子:“我要去首都機場”,導(dǎo)航其實是不知道你要去哪個航站樓的,但搭載了“知音”引擎后,導(dǎo)航會直接請用戶再發(fā)出更具體的指令,比如說出幾號航站樓, 或者直接說出航班號,“知音”引擎會以此為依據(jù),進一步確認目的地。

  在一些與我們生活更為貼近的方面,知音”引擎也在發(fā)揮作用,當(dāng)用戶發(fā)出“今天天氣怎么樣?”的指令時,由于意思明確非常容易理解,但當(dāng)用戶在給出答案之后再發(fā)出“那明天呢?”的指令時,通過語音技術(shù)的理解也可以正確給出明天的天氣預(yù)報。

   對于人類來說,剛才的兩句對話是有邏輯關(guān)系的,聽者非常容易就能明白“那明天呢?”指的是明天的天氣,但對于機器來說這并不簡單,基于對多輪對話技術(shù)的語義理解能力,“知音”引擎技術(shù)能識別出這兩條指令的前后關(guān)系,還是不錯的。

  注意:這項技術(shù)還在不斷的完善和優(yōu)化中,它無法達到人類的思維能力和水準(zhǔn),對于邏輯關(guān)系太復(fù)雜的指令還不能正確識別。

  目前搜狗旗下部分應(yīng)用已經(jīng)搭載了“知音”引擎技術(shù),比如搜狗的車載導(dǎo)航以及輸入法等等,它還在升級的過程當(dāng)中,未來可能會有更多的應(yīng)用接入“知音”引擎,同時搜狗也表示愿意和能力更強的合作伙伴一起提升語音輸入的交互體驗。


掃碼關(guān)注5G通信官方公眾號,免費領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費領(lǐng)取《中國移動:5G網(wǎng)絡(luò)AI應(yīng)用典型場景技術(shù)解決方案白皮書
  • 2、回復(fù)“5G6G”免費領(lǐng)取《5G_6G毫米波測試技術(shù)白皮書-2022_03-21
  • 3、回復(fù)“YD6G”免費領(lǐng)取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復(fù)“LTBPS”免費領(lǐng)取《《中國聯(lián)通5G終端白皮書》
  • 5、回復(fù)“ZGDX”免費領(lǐng)取《中國電信5G NTN技術(shù)白皮書
  • 6、回復(fù)“TXSB”免費領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費領(lǐng)取《中國移動算力并網(wǎng)白皮書
  • 8、回復(fù)“5GX3”免費領(lǐng)取《 R16 23501-g60 5G的系統(tǒng)架構(gòu)1
  • 對本帖內(nèi)容的看法? 我要點評

     
    [充值威望,立即自動到帳] [VIP貴賓權(quán)限+威望套餐] 另有大量優(yōu)惠贈送活動,請光臨充值中心
    充值擁有大量的威望和最高的下載權(quán)限,下載站內(nèi)資料無憂

    快速回復(fù)主題    
    標(biāo)題
    內(nèi)容
     上傳資料請點左側(cè)【添加附件】

    當(dāng)前時區(qū) GMT+8, 現(xiàn)在時間是 2025-01-22 13:13:19
    渝ICP備11001752號  Copyright @ 2006-2016 mscbsc.com  本站統(tǒng)一服務(wù)郵箱:mscbsc@163.com

    Processed in 0.313898 second(s), 13 queries , Gzip enabled
    TOP
    清除 Cookies - 聯(lián)系我們 - 移動通信網(wǎng) - 移動通信論壇 - 通信招聘網(wǎng) - Archiver