詞語解釋
PESQ(Perceptual Evaluation of Speech Quality)是一種用于評估語音質(zhì)量的標(biāo)準(zhǔn),它是一種用于評估語音信號傳輸質(zhì)量的國際標(biāo)準(zhǔn),由國際電信聯(lián)盟(ITU)制定。 PESQ是一種用于評估語音質(zhì)量的標(biāo)準(zhǔn),它可以根據(jù)接收到的語音信號的質(zhì)量來評估語音質(zhì)量。它使用一種稱為“均衡比”的技術(shù)來評估語音信號的質(zhì)量,并將其轉(zhuǎn)換為一個(gè)數(shù)字,以衡量語音信號的質(zhì)量。 PESQ可以用于評估各種類型的語音信號,包括無線電話、VoIP、數(shù)字傳輸系統(tǒng)和其他數(shù)字語音信號。它可以用于檢測和評估語音信號傳輸中的噪聲、失真和其他質(zhì)量問題,以確定語音信號的質(zhì)量。 PESQ的應(yīng)用主要是用于評估語音信號傳輸?shù)馁|(zhì)量。它可以用于評估傳輸系統(tǒng)的性能,例如評估無線電話和VoIP系統(tǒng)的性能,以確定語音信號的質(zhì)量。它還可以用于檢測和評估網(wǎng)絡(luò)中的噪聲、失真和其他質(zhì)量問題,以改善語音信號的質(zhì)量。 PESQ可以用于評估語音信號傳輸?shù)馁|(zhì)量,以改善語音信號的質(zhì)量。它可以用于評估傳輸系統(tǒng)的性能,以確定語音信號的質(zhì)量,也可以用于檢測和評估網(wǎng)絡(luò)中的噪聲、失真和其他質(zhì)量問題,以改善語音信號的質(zhì)量。此外,PESQ還可以用于評估語音信號的聲學(xué)特性,以改善語音信號的質(zhì)量。 總之,PESQ是一種用于評估語音質(zhì)量的標(biāo)準(zhǔn),它可以用于評估語音信號傳輸?shù)馁|(zhì)量,以改善語音信號的質(zhì)量,也可以用于評估傳輸系統(tǒng)的性能,以確定語音信號的質(zhì)量,并可以用于檢測和評估網(wǎng)絡(luò)中的噪聲、失真和其他質(zhì)量問題,以改善語音信號的質(zhì)量。 PESQ(Perceptual evaluation of speech quality) ITU-T P.862建議書提供的客觀MOS值評價(jià)方法 原理[編輯本段]如圖PESQ的結(jié)構(gòu)。開始時(shí)兩個(gè)信號都通過電平調(diào)整,再用輸入濾波器模擬標(biāo)準(zhǔn)電話聽筒進(jìn)行濾波(FFT)。這兩個(gè)信號要在時(shí)間上對準(zhǔn),并通過聽覺變換。這個(gè)變換包括對系統(tǒng)中線性濾波和增益變化的補(bǔ)償和均衡。提取出兩個(gè)失真參數(shù),在頻率和時(shí)間上總和起來,映射到對主觀平均意見分的預(yù)測。 計(jì)算PESQ的得分[編輯本段]為了訓(xùn)練PESQ,要在三個(gè)平均階段通過使用很多的p值計(jì)算很大數(shù)量的不同的對稱和非對稱的參數(shù)。先使用參數(shù)的線性組合來預(yù)測主觀MOS分,進(jìn)一步對每次主觀測試進(jìn)行回歸分析說明、解決不同的題目的前后關(guān)系和選擇的偏好,如第3部分中所討論的;這一步還用到了線性映射。對所有的候選參數(shù)集都進(jìn)行了選擇。這樣找到了最優(yōu)的組合,能給出最好的平均相關(guān)系數(shù)。這樣可以在幾百個(gè)候選參數(shù)中找到最好的。 舉例來說,PESQ中用到部分補(bǔ)償,在增益調(diào)制的均衡中,就要避免使用大量的參數(shù)來預(yù)測質(zhì)量。只用到兩個(gè)參數(shù)的組合— 一個(gè)對稱干擾(dSYM)和一個(gè)非對稱干擾(dASYM),在預(yù)測精度和概括能力上有很好的平衡。然而,由于低維數(shù)的模型依靠早先的階段組合出復(fù)雜的感知作用,要求有幾個(gè)迭代設(shè)計(jì)。聽覺變換中的系數(shù)和干擾處理經(jīng)過優(yōu)化,找到了最優(yōu)的參數(shù),然后重復(fù)處理過程。下面給出PESQ中映射的分: PESQMOS=4.5-0.1 dSYM-0.0309 dASYM 對于正規(guī)的主觀測試,得分在1.0和4.5之間。在失真情況嚴(yán)重時(shí),得分可能會低于1.0,但這種情況很少見。 范圍和應(yīng)用[編輯本段]ITU-T相關(guān)的資料已證明PESQ是能夠給出精確的預(yù)測值的,包括以下編解碼和誤碼失真,波形編碼(如G.711,G.726),CELP/高于4kbit/s的混合編解碼(如G.728),移動編解碼/系統(tǒng)(包括GSM FR、EFR、HR、AMR、CDMA EVRC、TDMA ACELP、VSELP和TETRA);各種編解碼的代碼轉(zhuǎn)換,隨機(jī)的、突發(fā)的、包丟失誤差。PESQ能夠用于編解碼或系統(tǒng)評估、選擇和優(yōu)化。 這樣PESQ可以廣泛的用于現(xiàn)場和模擬網(wǎng)絡(luò)中端到端測量。背景(環(huán)境)噪聲和噪聲處理,可以通過用PESQ比較干凈的、未處理的信號和編碼的、經(jīng)噪聲干擾失真的信號評估得到。 用靜默來取代語音,也是一種失真,給所有的感知模型在預(yù)測MOS分時(shí)帶來困難。一般前端和后端的50ms的削波(話音激活檢測)不會給主觀印象帶來很大的影響。然而,在話音期間削波,比如包丟失后用靜默代替,將嚴(yán)重影響主觀感受---每50ms的丟失,MOS分下降一分。PESQ的情況在這兩種之間,每50ms的削波通常引起0.5分左右的下降,而不管處于什么位置。對于前端暫時(shí)的削波,特別是未察覺的丟失了單詞時(shí),PESQ是很敏感的。相反的,PESQ對經(jīng)常的、短時(shí)的削波不很敏感(短時(shí)間內(nèi)語音被靜默取代)。在這兩種情況下,PESQ與主觀MOS分之間的相關(guān)性會減弱。 作為一個(gè)有固定假設(shè)聽覺級的只聽模型,PESQ一般不應(yīng)用來評估收聽級、側(cè)音/說話人回音,或?qū)υ捬舆t的影響,而且,它也不是供非入侵性測度使用的。其他一些應(yīng)用的特性還沒有得到證明,或者需要部分改變模型。包括:音樂音質(zhì);寬帶話音;所謂“媒體音頻質(zhì)量”;接受端回聲;低于4kbit/s的低比特率編解碼器;聲學(xué)的和電話機(jī)參考當(dāng)量測試。
PESQ(Perceptual evaluation of speech quality) ITU-T P.862建議書提供的客觀MOS值評價(jià)方法 原理[編輯本段]如圖PESQ的結(jié)構(gòu)。開始時(shí)兩個(gè)信號都通過電平調(diào)整,再用輸入濾波器模擬標(biāo)準(zhǔn)電話聽筒進(jìn)行濾波(FFT)。這兩個(gè)信號要在時(shí)間上對準(zhǔn),并通過聽覺變換。這個(gè)變換包括對系統(tǒng)中線性濾波和增益變化的補(bǔ)償和均衡。提取出兩個(gè)失真參數(shù),在頻率和時(shí)間上總和起來,映射到對主觀平均意見分的預(yù)測。 計(jì)算PESQ的得分[編輯本段]為了訓(xùn)練PESQ,要在三個(gè)平均階段通過使用很多的p值計(jì)算很大數(shù)量的不同的對稱和非對稱的參數(shù)。先使用參數(shù)的線性組合來預(yù)測主觀MOS分,進(jìn)一步對每次主觀測試進(jìn)行回歸分析說明、解決不同的題目的前后關(guān)系和選擇的偏好,如第3部分中所討論的;這一步還用到了線性映射。對所有的候選參數(shù)集都進(jìn)行了選擇。這樣找到了最優(yōu)的組合,能給出最好的平均相關(guān)系數(shù)。這樣可以在幾百個(gè)候選參數(shù)中找到最好的。 舉例來說,PESQ中用到部分補(bǔ)償,在增益調(diào)制的均衡中,就要避免使用大量的參數(shù)來預(yù)測質(zhì)量。只用到兩個(gè)參數(shù)的組合— 一個(gè)對稱干擾(dSYM)和一個(gè)非對稱干擾(dASYM),在預(yù)測精度和概括能力上有很好的平衡。然而,由于低維數(shù)的模型依靠早先的階段組合出復(fù)雜的感知作用,要求有幾個(gè)迭代設(shè)計(jì)。聽覺變換中的系數(shù)和干擾處理經(jīng)過優(yōu)化,找到了最優(yōu)的參數(shù),然后重復(fù)處理過程。下面給出PESQ中映射的分: PESQMOS=4.5-0.1 dSYM-0.0309 dASYM 對于正規(guī)的主觀測試,得分在1.0和4.5之間。在失真情況嚴(yán)重時(shí),得分可能會低于1.0,但這種情況很少見。 范圍和應(yīng)用[編輯本段]ITU-T相關(guān)的資料已證明PESQ是能夠給出精確的預(yù)測值的,包括以下編解碼和誤碼失真,波形編碼(如G.711,G.726),CELP/高于4kbit/s的混合編解碼(如G.728),移動編解碼/系統(tǒng)(包括GSM FR、EFR、HR、AMR、CDMA EVRC、TDMA ACELP、VSELP和TETRA);各種編解碼的代碼轉(zhuǎn)換,隨機(jī)的、突發(fā)的、包丟失誤差。PESQ能夠用于編解碼或系統(tǒng)評估、選擇和優(yōu)化。 這樣PESQ可以廣泛的用于現(xiàn)場和模擬網(wǎng)絡(luò)中端到端測量。背景(環(huán)境)噪聲和噪聲處理,可以通過用PESQ比較干凈的、未處理的信號和編碼的、經(jīng)噪聲干擾失真的信號評估得到。 用靜默來取代語音,也是一種失真,給所有的感知模型在預(yù)測MOS分時(shí)帶來困難。一般前端和后端的50ms的削波(話音激活檢測)不會給主觀印象帶來很大的影響。然而,在話音期間削波,比如包丟失后用靜默代替,將嚴(yán)重影響主觀感受---每50ms的丟失,MOS分下降一分。PESQ的情況在這兩種之間,每50ms的削波通常引起0.5分左右的下降,而不管處于什么位置。對于前端暫時(shí)的削波,特別是未察覺的丟失了單詞時(shí),PESQ是很敏感的。相反的,PESQ對經(jīng)常的、短時(shí)的削波不很敏感(短時(shí)間內(nèi)語音被靜默取代)。在這兩種情況下,PESQ與主觀MOS分之間的相關(guān)性會減弱。 作為一個(gè)有固定假設(shè)聽覺級的只聽模型,PESQ一般不應(yīng)用來評估收聽級、側(cè)音/說話人回音,或?qū)υ捬舆t的影響,而且,它也不是供非入侵性測度使用的。其他一些應(yīng)用的特性還沒有得到證明,或者需要部分改變模型。包括:音樂音質(zhì);寬帶話音;所謂“媒體音頻質(zhì)量”;接受端回聲;低于4kbit/s的低比特率編解碼器;聲學(xué)的和電話機(jī)參考當(dāng)量測試。
抱歉,此頁面的內(nèi)容受版權(quán)保護(hù),復(fù)制需扣除次數(shù),次數(shù)不足時(shí)需付費(fèi)購買。
如需下載請點(diǎn)擊:點(diǎn)擊此處下載
掃碼付費(fèi)即可復(fù)制
SIM卡 | let | 頻率復(fù)用 | GUTI | 網(wǎng)絡(luò)規(guī)劃 | 視頻 | 干放 | System | Motorola | 愛爾蘭 | 網(wǎng)優(yōu) | DRFU |
移動通信網(wǎng) | 通信人才網(wǎng) | 更新日志 | 團(tuán)隊(duì)博客 | 免責(zé)聲明 | 關(guān)于詞典 | 幫助