百科解釋
PESQ(Perceptual evaluation of speech quality) ITU-T P.862建議書(shū)提供的客觀MOS值評(píng)價(jià)方法 原理[編輯本段]如圖PESQ的結(jié)構(gòu)。開(kāi)始時(shí)兩個(gè)信號(hào)都通過(guò)電平調(diào)整,再用輸入濾波器模擬標(biāo)準(zhǔn)電話聽(tīng)筒進(jìn)行濾波(FFT)。這兩個(gè)信號(hào)要在時(shí)間上對(duì)準(zhǔn),并通過(guò)聽(tīng)覺(jué)變換。這個(gè)變換包括對(duì)系統(tǒng)中線性濾波和增益變化的補(bǔ)償和均衡。提取出兩個(gè)失真參數(shù),在頻率和時(shí)間上總和起來(lái),映射到對(duì)主觀平均意見(jiàn)分的預(yù)測(cè)。 計(jì)算PESQ的得分[編輯本段]為了訓(xùn)練PESQ,要在三個(gè)平均階段通過(guò)使用很多的p值計(jì)算很大數(shù)量的不同的對(duì)稱(chēng)和非對(duì)稱(chēng)的參數(shù)。先使用參數(shù)的線性組合來(lái)預(yù)測(cè)主觀MOS分,進(jìn)一步對(duì)每次主觀測(cè)試進(jìn)行回歸分析說(shuō)明、解決不同的題目的前后關(guān)系和選擇的偏好,如第3部分中所討論的;這一步還用到了線性映射。對(duì)所有的候選參數(shù)集都進(jìn)行了選擇。這樣找到了最優(yōu)的組合,能給出最好的平均相關(guān)系數(shù)。這樣可以在幾百個(gè)候選參數(shù)中找到最好的。 舉例來(lái)說(shuō),PESQ中用到部分補(bǔ)償,在增益調(diào)制的均衡中,就要避免使用大量的參數(shù)來(lái)預(yù)測(cè)質(zhì)量。只用到兩個(gè)參數(shù)的組合— 一個(gè)對(duì)稱(chēng)干擾(dSYM)和一個(gè)非對(duì)稱(chēng)干擾(dASYM),在預(yù)測(cè)精度和概括能力上有很好的平衡。然而,由于低維數(shù)的模型依靠早先的階段組合出復(fù)雜的感知作用,要求有幾個(gè)迭代設(shè)計(jì)。聽(tīng)覺(jué)變換中的系數(shù)和干擾處理經(jīng)過(guò)優(yōu)化,找到了最優(yōu)的參數(shù),然后重復(fù)處理過(guò)程。下面給出PESQ中映射的分: PESQMOS=4.5-0.1 dSYM-0.0309 dASYM 對(duì)于正規(guī)的主觀測(cè)試,得分在1.0和4.5之間。在失真情況嚴(yán)重時(shí),得分可能會(huì)低于1.0,但這種情況很少見(jiàn)。 范圍和應(yīng)用[編輯本段]ITU-T相關(guān)的資料已證明PESQ是能夠給出精確的預(yù)測(cè)值的,包括以下編解碼和誤碼失真,波形編碼(如G.711,G.726),CELP/高于4kbit/s的混合編解碼(如G.728),移動(dòng)編解碼/系統(tǒng)(包括GSM FR、EFR、HR、AMR、CDMA EVRC、TDMA ACELP、VSELP和TETRA);各種編解碼的代碼轉(zhuǎn)換,隨機(jī)的、突發(fā)的、包丟失誤差。PESQ能夠用于編解碼或系統(tǒng)評(píng)估、選擇和優(yōu)化。 這樣PESQ可以廣泛的用于現(xiàn)場(chǎng)和模擬網(wǎng)絡(luò)中端到端測(cè)量。背景(環(huán)境)噪聲和噪聲處理,可以通過(guò)用PESQ比較干凈的、未處理的信號(hào)和編碼的、經(jīng)噪聲干擾失真的信號(hào)評(píng)估得到。 用靜默來(lái)取代語(yǔ)音,也是一種失真,給所有的感知模型在預(yù)測(cè)MOS分時(shí)帶來(lái)困難。一般前端和后端的50ms的削波(話音激活檢測(cè))不會(huì)給主觀印象帶來(lái)很大的影響。然而,在話音期間削波,比如包丟失后用靜默代替,將嚴(yán)重影響主觀感受---每50ms的丟失,MOS分下降一分。PESQ的情況在這兩種之間,每50ms的削波通常引起0.5分左右的下降,而不管處于什么位置。對(duì)于前端暫時(shí)的削波,特別是未察覺(jué)的丟失了單詞時(shí),PESQ是很敏感的。相反的,PESQ對(duì)經(jīng)常的、短時(shí)的削波不很敏感(短時(shí)間內(nèi)語(yǔ)音被靜默取代)。在這兩種情況下,PESQ與主觀MOS分之間的相關(guān)性會(huì)減弱。 作為一個(gè)有固定假設(shè)聽(tīng)覺(jué)級(jí)的只聽(tīng)模型,PESQ一般不應(yīng)用來(lái)評(píng)估收聽(tīng)級(jí)、側(cè)音/說(shuō)話人回音,或?qū)υ捬舆t的影響,而且,它也不是供非入侵性測(cè)度使用的。其他一些應(yīng)用的特性還沒(méi)有得到證明,或者需要部分改變模型。包括:音樂(lè)音質(zhì);寬帶話音;所謂“媒體音頻質(zhì)量”;接受端回聲;低于4kbit/s的低比特率編解碼器;聲學(xué)的和電話機(jī)參考當(dāng)量測(cè)試。
移動(dòng)通信網(wǎng) | 通信人才網(wǎng) | 更新日志 | 團(tuán)隊(duì)博客 | 免責(zé)聲明 | 關(guān)于詞典 | 幫助