詞語解釋
PESQ(Perceptual Evaluation of Speech Quality)是一種用于評(píng)估語音質(zhì)量的標(biāo)準(zhǔn),它是一種用于評(píng)估語音信號(hào)傳輸質(zhì)量的國際標(biāo)準(zhǔn),由國際電信聯(lián)盟(ITU)制定。 PESQ是一種用于評(píng)估語音質(zhì)量的標(biāo)準(zhǔn),它可以根據(jù)接收到的語音信號(hào)的質(zhì)量來評(píng)估語音質(zhì)量。它使用一種稱為“均衡比”的技術(shù)來評(píng)估語音信號(hào)的質(zhì)量,并將其轉(zhuǎn)換為一個(gè)數(shù)字,以衡量語音信號(hào)的質(zhì)量。 PESQ可以用于評(píng)估各種類型的語音信號(hào),包括無線電話、VoIP、數(shù)字傳輸系統(tǒng)和其他數(shù)字語音信號(hào)。它可以用于檢測(cè)和評(píng)估語音信號(hào)傳輸中的噪聲、失真和其他質(zhì)量問題,以確定語音信號(hào)的質(zhì)量。 PESQ的應(yīng)用主要是用于評(píng)估語音信號(hào)傳輸?shù)馁|(zhì)量。它可以用于評(píng)估傳輸系統(tǒng)的性能,例如評(píng)估無線電話和VoIP系統(tǒng)的性能,以確定語音信號(hào)的質(zhì)量。它還可以用于檢測(cè)和評(píng)估網(wǎng)絡(luò)中的噪聲、失真和其他質(zhì)量問題,以改善語音信號(hào)的質(zhì)量。 PESQ可以用于評(píng)估語音信號(hào)傳輸?shù)馁|(zhì)量,以改善語音信號(hào)的質(zhì)量。它可以用于評(píng)估傳輸系統(tǒng)的性能,以確定語音信號(hào)的質(zhì)量,也可以用于檢測(cè)和評(píng)估網(wǎng)絡(luò)中的噪聲、失真和其他質(zhì)量問題,以改善語音信號(hào)的質(zhì)量。此外,PESQ還可以用于評(píng)估語音信號(hào)的聲學(xué)特性,以改善語音信號(hào)的質(zhì)量。 總之,PESQ是一種用于評(píng)估語音質(zhì)量的標(biāo)準(zhǔn),它可以用于評(píng)估語音信號(hào)傳輸?shù)馁|(zhì)量,以改善語音信號(hào)的質(zhì)量,也可以用于評(píng)估傳輸系統(tǒng)的性能,以確定語音信號(hào)的質(zhì)量,并可以用于檢測(cè)和評(píng)估網(wǎng)絡(luò)中的噪聲、失真和其他質(zhì)量問題,以改善語音信號(hào)的質(zhì)量。 PESQ(Perceptual evaluation of speech quality) ITU-T P.862建議書提供的客觀MOS值評(píng)價(jià)方法 原理[編輯本段]如圖PESQ的結(jié)構(gòu)。開始時(shí)兩個(gè)信號(hào)都通過電平調(diào)整,再用輸入濾波器模擬標(biāo)準(zhǔn)電話聽筒進(jìn)行濾波(FFT)。這兩個(gè)信號(hào)要在時(shí)間上對(duì)準(zhǔn),并通過聽覺變換。這個(gè)變換包括對(duì)系統(tǒng)中線性濾波和增益變化的補(bǔ)償和均衡。提取出兩個(gè)失真參數(shù),在頻率和時(shí)間上總和起來,映射到對(duì)主觀平均意見分的預(yù)測(cè)。 計(jì)算PESQ的得分[編輯本段]為了訓(xùn)練PESQ,要在三個(gè)平均階段通過使用很多的p值計(jì)算很大數(shù)量的不同的對(duì)稱和非對(duì)稱的參數(shù)。先使用參數(shù)的線性組合來預(yù)測(cè)主觀MOS分,進(jìn)一步對(duì)每次主觀測(cè)試進(jìn)行回歸分析說明、解決不同的題目的前后關(guān)系和選擇的偏好,如第3部分中所討論的;這一步還用到了線性映射。對(duì)所有的候選參數(shù)集都進(jìn)行了選擇。這樣找到了最優(yōu)的組合,能給出最好的平均相關(guān)系數(shù)。這樣可以在幾百個(gè)候選參數(shù)中找到最好的。 舉例來說,PESQ中用到部分補(bǔ)償,在增益調(diào)制的均衡中,就要避免使用大量的參數(shù)來預(yù)測(cè)質(zhì)量。只用到兩個(gè)參數(shù)的組合— 一個(gè)對(duì)稱干擾(dSYM)和一個(gè)非對(duì)稱干擾(dASYM),在預(yù)測(cè)精度和概括能力上有很好的平衡。然而,由于低維數(shù)的模型依靠早先的階段組合出復(fù)雜的感知作用,要求有幾個(gè)迭代設(shè)計(jì)。聽覺變換中的系數(shù)和干擾處理經(jīng)過優(yōu)化,找到了最優(yōu)的參數(shù),然后重復(fù)處理過程。下面給出PESQ中映射的分: PESQMOS=4.5-0.1 dSYM-0.0309 dASYM 對(duì)于正規(guī)的主觀測(cè)試,得分在1.0和4.5之間。在失真情況嚴(yán)重時(shí),得分可能會(huì)低于1.0,但這種情況很少見。 范圍和應(yīng)用[編輯本段]ITU-T相關(guān)的資料已證明PESQ是能夠給出精確的預(yù)測(cè)值的,包括以下編解碼和誤碼失真,波形編碼(如G.711,G.726),CELP/高于4kbit/s的混合編解碼(如G.728),移動(dòng)編解碼/系統(tǒng)(包括GSM FR、EFR、HR、AMR、CDMA EVRC、TDMA ACELP、VSELP和TETRA);各種編解碼的代碼轉(zhuǎn)換,隨機(jī)的、突發(fā)的、包丟失誤差。PESQ能夠用于編解碼或系統(tǒng)評(píng)估、選擇和優(yōu)化。 這樣PESQ可以廣泛的用于現(xiàn)場(chǎng)和模擬網(wǎng)絡(luò)中端到端測(cè)量。背景(環(huán)境)噪聲和噪聲處理,可以通過用PESQ比較干凈的、未處理的信號(hào)和編碼的、經(jīng)噪聲干擾失真的信號(hào)評(píng)估得到。 用靜默來取代語音,也是一種失真,給所有的感知模型在預(yù)測(cè)MOS分時(shí)帶來困難。一般前端和后端的50ms的削波(話音激活檢測(cè))不會(huì)給主觀印象帶來很大的影響。然而,在話音期間削波,比如包丟失后用靜默代替,將嚴(yán)重影響主觀感受---每50ms的丟失,MOS分下降一分。PESQ的情況在這兩種之間,每50ms的削波通常引起0.5分左右的下降,而不管處于什么位置。對(duì)于前端暫時(shí)的削波,特別是未察覺的丟失了單詞時(shí),PESQ是很敏感的。相反的,PESQ對(duì)經(jīng)常的、短時(shí)的削波不很敏感(短時(shí)間內(nèi)語音被靜默取代)。在這兩種情況下,PESQ與主觀MOS分之間的相關(guān)性會(huì)減弱。 作為一個(gè)有固定假設(shè)聽覺級(jí)的只聽模型,PESQ一般不應(yīng)用來評(píng)估收聽級(jí)、側(cè)音/說話人回音,或?qū)υ捬舆t的影響,而且,它也不是供非入侵性測(cè)度使用的。其他一些應(yīng)用的特性還沒有得到證明,或者需要部分改變模型。包括:音樂音質(zhì);寬帶話音;所謂“媒體音頻質(zhì)量”;接受端回聲;低于4kbit/s的低比特率編解碼器;聲學(xué)的和電話機(jī)參考當(dāng)量測(cè)試。
PESQ(Perceptual evaluation of speech quality) ITU-T P.862建議書提供的客觀MOS值評(píng)價(jià)方法 原理[編輯本段]如圖PESQ的結(jié)構(gòu)。開始時(shí)兩個(gè)信號(hào)都通過電平調(diào)整,再用輸入濾波器模擬標(biāo)準(zhǔn)電話聽筒進(jìn)行濾波(FFT)。這兩個(gè)信號(hào)要在時(shí)間上對(duì)準(zhǔn),并通過聽覺變換。這個(gè)變換包括對(duì)系統(tǒng)中線性濾波和增益變化的補(bǔ)償和均衡。提取出兩個(gè)失真參數(shù),在頻率和時(shí)間上總和起來,映射到對(duì)主觀平均意見分的預(yù)測(cè)。 計(jì)算PESQ的得分[編輯本段]為了訓(xùn)練PESQ,要在三個(gè)平均階段通過使用很多的p值計(jì)算很大數(shù)量的不同的對(duì)稱和非對(duì)稱的參數(shù)。先使用參數(shù)的線性組合來預(yù)測(cè)主觀MOS分,進(jìn)一步對(duì)每次主觀測(cè)試進(jìn)行回歸分析說明、解決不同的題目的前后關(guān)系和選擇的偏好,如第3部分中所討論的;這一步還用到了線性映射。對(duì)所有的候選參數(shù)集都進(jìn)行了選擇。這樣找到了最優(yōu)的組合,能給出最好的平均相關(guān)系數(shù)。這樣可以在幾百個(gè)候選參數(shù)中找到最好的。 舉例來說,PESQ中用到部分補(bǔ)償,在增益調(diào)制的均衡中,就要避免使用大量的參數(shù)來預(yù)測(cè)質(zhì)量。只用到兩個(gè)參數(shù)的組合— 一個(gè)對(duì)稱干擾(dSYM)和一個(gè)非對(duì)稱干擾(dASYM),在預(yù)測(cè)精度和概括能力上有很好的平衡。然而,由于低維數(shù)的模型依靠早先的階段組合出復(fù)雜的感知作用,要求有幾個(gè)迭代設(shè)計(jì)。聽覺變換中的系數(shù)和干擾處理經(jīng)過優(yōu)化,找到了最優(yōu)的參數(shù),然后重復(fù)處理過程。下面給出PESQ中映射的分: PESQMOS=4.5-0.1 dSYM-0.0309 dASYM 對(duì)于正規(guī)的主觀測(cè)試,得分在1.0和4.5之間。在失真情況嚴(yán)重時(shí),得分可能會(huì)低于1.0,但這種情況很少見。 范圍和應(yīng)用[編輯本段]ITU-T相關(guān)的資料已證明PESQ是能夠給出精確的預(yù)測(cè)值的,包括以下編解碼和誤碼失真,波形編碼(如G.711,G.726),CELP/高于4kbit/s的混合編解碼(如G.728),移動(dòng)編解碼/系統(tǒng)(包括GSM FR、EFR、HR、AMR、CDMA EVRC、TDMA ACELP、VSELP和TETRA);各種編解碼的代碼轉(zhuǎn)換,隨機(jī)的、突發(fā)的、包丟失誤差。PESQ能夠用于編解碼或系統(tǒng)評(píng)估、選擇和優(yōu)化。 這樣PESQ可以廣泛的用于現(xiàn)場(chǎng)和模擬網(wǎng)絡(luò)中端到端測(cè)量。背景(環(huán)境)噪聲和噪聲處理,可以通過用PESQ比較干凈的、未處理的信號(hào)和編碼的、經(jīng)噪聲干擾失真的信號(hào)評(píng)估得到。 用靜默來取代語音,也是一種失真,給所有的感知模型在預(yù)測(cè)MOS分時(shí)帶來困難。一般前端和后端的50ms的削波(話音激活檢測(cè))不會(huì)給主觀印象帶來很大的影響。然而,在話音期間削波,比如包丟失后用靜默代替,將嚴(yán)重影響主觀感受---每50ms的丟失,MOS分下降一分。PESQ的情況在這兩種之間,每50ms的削波通常引起0.5分左右的下降,而不管處于什么位置。對(duì)于前端暫時(shí)的削波,特別是未察覺的丟失了單詞時(shí),PESQ是很敏感的。相反的,PESQ對(duì)經(jīng)常的、短時(shí)的削波不很敏感(短時(shí)間內(nèi)語音被靜默取代)。在這兩種情況下,PESQ與主觀MOS分之間的相關(guān)性會(huì)減弱。 作為一個(gè)有固定假設(shè)聽覺級(jí)的只聽模型,PESQ一般不應(yīng)用來評(píng)估收聽級(jí)、側(cè)音/說話人回音,或?qū)υ捬舆t的影響,而且,它也不是供非入侵性測(cè)度使用的。其他一些應(yīng)用的特性還沒有得到證明,或者需要部分改變模型。包括:音樂音質(zhì);寬帶話音;所謂“媒體音頻質(zhì)量”;接受端回聲;低于4kbit/s的低比特率編解碼器;聲學(xué)的和電話機(jī)參考當(dāng)量測(cè)試。
抱歉,此頁面的內(nèi)容受版權(quán)保護(hù),復(fù)制需扣除次數(shù),次數(shù)不足時(shí)需付費(fèi)購買。
如需下載請(qǐng)點(diǎn)擊:點(diǎn)擊此處下載
掃碼付費(fèi)即可復(fù)制
SIM卡 | let | 頻率復(fù)用 | GUTI | 網(wǎng)絡(luò)規(guī)劃 | 視頻 | 干放 | System | Motorola | 愛爾蘭 | 網(wǎng)優(yōu) | DRFU |
移動(dòng)通信網(wǎng) | 通信人才網(wǎng) | 更新日志 | 團(tuán)隊(duì)博客 | 免責(zé)聲明 | 關(guān)于詞典 | 幫助