詞語解釋
PESQ(Perceptual Evaluation of Speech Quality)是一種用于評估語音質(zhì)量的標準,它是一種用于評估語音信號傳輸質(zhì)量的國際標準,由國際電信聯(lián)盟(ITU)制定。 PESQ是一種用于評估語音質(zhì)量的標準,它可以根據(jù)接收到的語音信號的質(zhì)量來評估語音質(zhì)量。它使用一種稱為“均衡比”的技術(shù)來評估語音信號的質(zhì)量,并將其轉(zhuǎn)換為一個數(shù)字,以衡量語音信號的質(zhì)量。 PESQ可以用于評估各種類型的語音信號,包括無線電話、VoIP、數(shù)字傳輸系統(tǒng)和其他數(shù)字語音信號。它可以用于檢測和評估語音信號傳輸中的噪聲、失真和其他質(zhì)量問題,以確定語音信號的質(zhì)量。 PESQ的應(yīng)用主要是用于評估語音信號傳輸?shù)馁|(zhì)量。它可以用于評估傳輸系統(tǒng)的性能,例如評估無線電話和VoIP系統(tǒng)的性能,以確定語音信號的質(zhì)量。它還可以用于檢測和評估網(wǎng)絡(luò)中的噪聲、失真和其他質(zhì)量問題,以改善語音信號的質(zhì)量。 PESQ可以用于評估語音信號傳輸?shù)馁|(zhì)量,以改善語音信號的質(zhì)量。它可以用于評估傳輸系統(tǒng)的性能,以確定語音信號的質(zhì)量,也可以用于檢測和評估網(wǎng)絡(luò)中的噪聲、失真和其他質(zhì)量問題,以改善語音信號的質(zhì)量。此外,PESQ還可以用于評估語音信號的聲學特性,以改善語音信號的質(zhì)量。 總之,PESQ是一種用于評估語音質(zhì)量的標準,它可以用于評估語音信號傳輸?shù)馁|(zhì)量,以改善語音信號的質(zhì)量,也可以用于評估傳輸系統(tǒng)的性能,以確定語音信號的質(zhì)量,并可以用于檢測和評估網(wǎng)絡(luò)中的噪聲、失真和其他質(zhì)量問題,以改善語音信號的質(zhì)量。 PESQ(Perceptual evaluation of speech quality) ITU-T P.862建議書提供的客觀MOS值評價方法 原理[編輯本段]如圖PESQ的結(jié)構(gòu)。開始時兩個信號都通過電平調(diào)整,再用輸入濾波器模擬標準電話聽筒進行濾波(FFT)。這兩個信號要在時間上對準,并通過聽覺變換。這個變換包括對系統(tǒng)中線性濾波和增益變化的補償和均衡。提取出兩個失真參數(shù),在頻率和時間上總和起來,映射到對主觀平均意見分的預(yù)測。 計算PESQ的得分[編輯本段]為了訓練PESQ,要在三個平均階段通過使用很多的p值計算很大數(shù)量的不同的對稱和非對稱的參數(shù)。先使用參數(shù)的線性組合來預(yù)測主觀MOS分,進一步對每次主觀測試進行回歸分析說明、解決不同的題目的前后關(guān)系和選擇的偏好,如第3部分中所討論的;這一步還用到了線性映射。對所有的候選參數(shù)集都進行了選擇。這樣找到了最優(yōu)的組合,能給出最好的平均相關(guān)系數(shù)。這樣可以在幾百個候選參數(shù)中找到最好的。 舉例來說,PESQ中用到部分補償,在增益調(diào)制的均衡中,就要避免使用大量的參數(shù)來預(yù)測質(zhì)量。只用到兩個參數(shù)的組合— 一個對稱干擾(dSYM)和一個非對稱干擾(dASYM),在預(yù)測精度和概括能力上有很好的平衡。然而,由于低維數(shù)的模型依靠早先的階段組合出復(fù)雜的感知作用,要求有幾個迭代設(shè)計。聽覺變換中的系數(shù)和干擾處理經(jīng)過優(yōu)化,找到了最優(yōu)的參數(shù),然后重復(fù)處理過程。下面給出PESQ中映射的分: PESQMOS=4.5-0.1 dSYM-0.0309 dASYM 對于正規(guī)的主觀測試,得分在1.0和4.5之間。在失真情況嚴重時,得分可能會低于1.0,但這種情況很少見。 范圍和應(yīng)用[編輯本段]ITU-T相關(guān)的資料已證明PESQ是能夠給出精確的預(yù)測值的,包括以下編解碼和誤碼失真,波形編碼(如G.711,G.726),CELP/高于4kbit/s的混合編解碼(如G.728),移動編解碼/系統(tǒng)(包括GSM FR、EFR、HR、AMR、CDMA EVRC、TDMA ACELP、VSELP和TETRA);各種編解碼的代碼轉(zhuǎn)換,隨機的、突發(fā)的、包丟失誤差。PESQ能夠用于編解碼或系統(tǒng)評估、選擇和優(yōu)化。 這樣PESQ可以廣泛的用于現(xiàn)場和模擬網(wǎng)絡(luò)中端到端測量。背景(環(huán)境)噪聲和噪聲處理,可以通過用PESQ比較干凈的、未處理的信號和編碼的、經(jīng)噪聲干擾失真的信號評估得到。 用靜默來取代語音,也是一種失真,給所有的感知模型在預(yù)測MOS分時帶來困難。一般前端和后端的50ms的削波(話音激活檢測)不會給主觀印象帶來很大的影響。然而,在話音期間削波,比如包丟失后用靜默代替,將嚴重影響主觀感受---每50ms的丟失,MOS分下降一分。PESQ的情況在這兩種之間,每50ms的削波通常引起0.5分左右的下降,而不管處于什么位置。對于前端暫時的削波,特別是未察覺的丟失了單詞時,PESQ是很敏感的。相反的,PESQ對經(jīng)常的、短時的削波不很敏感(短時間內(nèi)語音被靜默取代)。在這兩種情況下,PESQ與主觀MOS分之間的相關(guān)性會減弱。 作為一個有固定假設(shè)聽覺級的只聽模型,PESQ一般不應(yīng)用來評估收聽級、側(cè)音/說話人回音,或?qū)υ捬舆t的影響,而且,它也不是供非入侵性測度使用的。其他一些應(yīng)用的特性還沒有得到證明,或者需要部分改變模型。包括:音樂音質(zhì);寬帶話音;所謂“媒體音頻質(zhì)量”;接受端回聲;低于4kbit/s的低比特率編解碼器;聲學的和電話機參考當量測試。
PESQ(Perceptual evaluation of speech quality) ITU-T P.862建議書提供的客觀MOS值評價方法 原理[編輯本段]如圖PESQ的結(jié)構(gòu)。開始時兩個信號都通過電平調(diào)整,再用輸入濾波器模擬標準電話聽筒進行濾波(FFT)。這兩個信號要在時間上對準,并通過聽覺變換。這個變換包括對系統(tǒng)中線性濾波和增益變化的補償和均衡。提取出兩個失真參數(shù),在頻率和時間上總和起來,映射到對主觀平均意見分的預(yù)測。 計算PESQ的得分[編輯本段]為了訓練PESQ,要在三個平均階段通過使用很多的p值計算很大數(shù)量的不同的對稱和非對稱的參數(shù)。先使用參數(shù)的線性組合來預(yù)測主觀MOS分,進一步對每次主觀測試進行回歸分析說明、解決不同的題目的前后關(guān)系和選擇的偏好,如第3部分中所討論的;這一步還用到了線性映射。對所有的候選參數(shù)集都進行了選擇。這樣找到了最優(yōu)的組合,能給出最好的平均相關(guān)系數(shù)。這樣可以在幾百個候選參數(shù)中找到最好的。 舉例來說,PESQ中用到部分補償,在增益調(diào)制的均衡中,就要避免使用大量的參數(shù)來預(yù)測質(zhì)量。只用到兩個參數(shù)的組合— 一個對稱干擾(dSYM)和一個非對稱干擾(dASYM),在預(yù)測精度和概括能力上有很好的平衡。然而,由于低維數(shù)的模型依靠早先的階段組合出復(fù)雜的感知作用,要求有幾個迭代設(shè)計。聽覺變換中的系數(shù)和干擾處理經(jīng)過優(yōu)化,找到了最優(yōu)的參數(shù),然后重復(fù)處理過程。下面給出PESQ中映射的分: PESQMOS=4.5-0.1 dSYM-0.0309 dASYM 對于正規(guī)的主觀測試,得分在1.0和4.5之間。在失真情況嚴重時,得分可能會低于1.0,但這種情況很少見。 范圍和應(yīng)用[編輯本段]ITU-T相關(guān)的資料已證明PESQ是能夠給出精確的預(yù)測值的,包括以下編解碼和誤碼失真,波形編碼(如G.711,G.726),CELP/高于4kbit/s的混合編解碼(如G.728),移動編解碼/系統(tǒng)(包括GSM FR、EFR、HR、AMR、CDMA EVRC、TDMA ACELP、VSELP和TETRA);各種編解碼的代碼轉(zhuǎn)換,隨機的、突發(fā)的、包丟失誤差。PESQ能夠用于編解碼或系統(tǒng)評估、選擇和優(yōu)化。 這樣PESQ可以廣泛的用于現(xiàn)場和模擬網(wǎng)絡(luò)中端到端測量。背景(環(huán)境)噪聲和噪聲處理,可以通過用PESQ比較干凈的、未處理的信號和編碼的、經(jīng)噪聲干擾失真的信號評估得到。 用靜默來取代語音,也是一種失真,給所有的感知模型在預(yù)測MOS分時帶來困難。一般前端和后端的50ms的削波(話音激活檢測)不會給主觀印象帶來很大的影響。然而,在話音期間削波,比如包丟失后用靜默代替,將嚴重影響主觀感受---每50ms的丟失,MOS分下降一分。PESQ的情況在這兩種之間,每50ms的削波通常引起0.5分左右的下降,而不管處于什么位置。對于前端暫時的削波,特別是未察覺的丟失了單詞時,PESQ是很敏感的。相反的,PESQ對經(jīng)常的、短時的削波不很敏感(短時間內(nèi)語音被靜默取代)。在這兩種情況下,PESQ與主觀MOS分之間的相關(guān)性會減弱。 作為一個有固定假設(shè)聽覺級的只聽模型,PESQ一般不應(yīng)用來評估收聽級、側(cè)音/說話人回音,或?qū)υ捬舆t的影響,而且,它也不是供非入侵性測度使用的。其他一些應(yīng)用的特性還沒有得到證明,或者需要部分改變模型。包括:音樂音質(zhì);寬帶話音;所謂“媒體音頻質(zhì)量”;接受端回聲;低于4kbit/s的低比特率編解碼器;聲學的和電話機參考當量測試。
抱歉,此頁面的內(nèi)容受版權(quán)保護,復(fù)制需扣除次數(shù),次數(shù)不足時需付費購買。
如需下載請點擊:點擊此處下載
掃碼付費即可復(fù)制
載干比 | 信噪比 | 前向業(yè)務(wù)信道 | 空分復(fù)用 | SQI | 彩信 | DX | HSPA | 標簽 | r99 | alcap | Android |
移動通信網(wǎng) | 通信人才網(wǎng) | 更新日志 | 團隊博客 | 免責聲明 | 關(guān)于詞典 | 幫助