摘要 基于E-Model的語音質量測量方法是一種客觀測試方法,它克服了傳統(tǒng)語音質量測試在數(shù)據(jù)網絡測量中的不足。為了能夠準確評估VoIP語音質量,在E-Model算法的基礎之上,探討了延時、噪聲、回音、語音壓縮等損傷因素對VoIP語音質量的影響。
1、引言
VoIP(Voice over IP),以IP分組交換網絡為傳輸平臺,對模擬的語音信號進行壓縮、打包等一系列的特殊處理,使之可以采用無連接的UDP(User Datagram Protocol)協(xié)議進行傳輸[1]。近年來,隨著IP網絡技術的廣泛應用,VoIP成為一種新興的電話通信方式,IP網絡所提供的語音質量問題受到人們的普遍關注,如何對語音質量進行科學可靠的測量和評價是網絡測量和網絡規(guī)劃設計中十分關鍵的問題。E-Model作為語音質量測量的一種新方法,它適合數(shù)據(jù)網絡的語音質量測量,必將有廣泛的應用。本文將在E模型下分析延時、噪聲、回音和語音壓縮等對VoIP語音質量的影響。
2、基于E-Model的語音質量評價
目前對IP電話業(yè)務語音質量評分的評價分為主觀評價和客觀評價。主觀評價方法主要是MOS模型(平均評定得分法),還包括判斷滿意度測量等方法;客觀評價方法主要有PSQM模型(感知話音質量測量法)、PAMS模型(感知分析測量法)、PESQ模型(感知話音評估法)和E-Model[2,3]。傳統(tǒng)的測量方式不是基于數(shù)據(jù)網絡的,不能反映延時、抖動和丟包等數(shù)據(jù)網絡特有的問題。
在ITU-T P.800中規(guī)定的平均主觀值MOS,基于該主觀評測把人接聽和感知語音質量的行為被調研和量化,接聽到何種級別質量的語音,就得到多少平均主觀值MOS。一般情況下MOS值是4或更高被認為是比較好的語音質量,而若平均主觀值MOS低于3.6,則大部分接聽者不能滿意語音質量。平均主觀測試雖然準確有效,但是這種方法存在的最大問題就是實現(xiàn)起來非常麻煩和昂貴,因此人們在不斷地探索能進行客觀測量的方法。ITU-T的G.107標準提出的E模型考慮了延時、噪聲、回音、編碼器性能、丟包、抖動等網絡損傷因素對語音質量的影響。它的評價標準如圖1所示。
圖1 用戶滿意度等級與R值和MOS值的范圍對應表
根據(jù)ITU-T G.107的定義和實際測試所需的參數(shù)可以求出R的值。傳輸參數(shù)R的表達式為:
其中
(1)Ro表示基本的信噪比,Ro的表達式為:
其中,SLR表示發(fā)送端響度評測值,No表示不同噪聲源功率之和。
No的表達式為:
其中,Nc表示電路引起的所有哚聲功率之和,Nos表示發(fā)送端背景噪聲引起的電路噪聲,Nor表示接收端背景噪聲引起的電路噪聲,Nfo表示接收端的噪聲。影響Ro的主要因素包括:響度評測值(SLR,RLR),背景噪聲(Ps,Pr),電話延遲值(Ds,Dr),說話者回音響度額定值(TELR)。
(2)Is表示語音實時傳輸所產生的同步損傷,Is的表達式為:
其中,Iolr表示是由太低的響度評測值所引起的質量的下降,Ist表示是由非適宜的電話噪聲引起的損傷,Iq表示量化失真所造成的損傷。影響Is的主要因素有:響度評測值,背景噪聲,電話延遲值,說話者回音響度額定值,單向延遲時間(T),量化失真度(qdu)。
(3)Id表示語音信號的延遲損傷,Id的表達式為:
其中,Idte表示發(fā)送端回音所造成的損傷,Idle表示接收端回音所造成的損傷,Idd表示太長的絕對延遲所引起的損傷。影響Id的主要因素有:延遲,說話者回音響度,背景噪聲,響度評測值等。
(4)Ie-eff表示低比特率編碼及丟包所造成的損傷,Ie-eff的表達式為:
其中Ie表示設備損傷因素,Bbl表示丟包主要因素,Ppl表示丟包率。
(5)A表示優(yōu)勢損傷因素,它是當有其它優(yōu)勢傳遞到用戶的一種補償,通常情況下設置為零[4]。
在E-Model測量中包含了影響窄帶電話通話質量的多種傳輸參數(shù),在ITU-T G.107中提供了一組默認值,當終端和應用環(huán)境是正常的,可以直接使用這些默認值。根據(jù)這些默認值和一些可求的參數(shù)比如延時、丟包率等可以得到E-Model輸出的傳輸參數(shù)R。R直越大,說明語音質量越好,R值的范圍是0-100,0是最差的,100是最好的。
平均主觀值MOS是1-5之間的數(shù),1是語音質量最差的,5是語音質量最好的。R值可以通過下面的公式轉化成MOS分:
IP電話網絡損傷的主要因素包括延時、噪聲、回音、語音編碼和丟包[5,6]:
(1)延時(delay),指IP包從網絡入口點到達網絡出口點所需要的傳輸時間。如果在一個呼叫中包含不同的通路時間,則存在抖動,抖動越大則語音質量下降的越明顯。在E模型中采用固定緩沖區(qū)的方法,可以使抖動的影響轉化為延時[7]。
(2)回音(echo),是由語音網絡中的電氣反射引起的,延時超過16 ms的回聲對說話人會有影響。下文通過說話者回音響度額定值(TELR),來檢測回音對語音質量的影響。
(3)噪聲(noise),是影響語音質量的一個關鍵因素,下文分別通過發(fā)送端背景噪聲Ps和接收端背景噪聲Pr來分析噪聲對語音質量的影響。
(4)語音壓縮(Speech compression),在語音處理中語音編碼有很多種方式,每一種都有不同的特點。低速的編碼方式占用較少的帶寬,但是低速編碼使用有損的壓縮算法,削弱了語音質量。仿真將采用標準為G.711、G.729 A、G.723.1的編碼方式,演示編碼對語音質量的影響,其主要參數(shù)如表1所示。
表1 標準編碼器的主要參數(shù)
(5)丟包(Packet loss),是影響語音質量的又一個關鍵因素。數(shù)據(jù)包發(fā)送端和接收端之間的數(shù)據(jù)包數(shù)目的差值即為網絡傳輸丟失包數(shù)目。當少量的丟包且是隨機地分布時,人耳并不容易感覺到較差的語音質量。當丟包數(shù)量變大時,語音質量也就相應的變差。
3、仿真結果
(1)圖2演示了延時和說話者回音響度額定值(TELR)對R值的影響:時延在0~500 ms變化時,相應的R值隨時延的增長而降低,另外,從仿真結果也可以看出,TELR對R值的影響也是很大的,TELT=65 dB時,R值隨延時變化的相對緩慢,隨著TELR值的減小,R值隨延時的增加而迅速降低,且在相同的時延條件下,TELR越大,得到的R值也越大。
圖2 延時、回音額定值對R值的影響
(2)從圖3仿真結果可以看出語音編碼對R值的影響:選擇越低速率的編碼方式,得到的R值就越小。在實際情況中,選擇低速的編碼方式能夠在相同的連接上建立更多的呼叫,但是引入了更大的延時,使語音質量對丟包也更加敏感。如果需要很高的語音質量,則意味著只能使用64 kbit/s的G.711編碼方式。
圖3 語音編碼對R值的影響
(3)從圖4仿真結果可以看出,發(fā)送端背景噪聲Ps和接收端背景噪聲Pr對MOS值的影響:背景噪聲小于40 dB時,對語音質量沒有太大的影響,當背景噪聲大于40 dB,語音質量會迅速下降。
圖4 噪聲對MOS值的影響
4、結束語
E-Model是一種語音質量測量的新方法,在網絡規(guī)劃和語音監(jiān)測方面有著廣泛的應用。隨著IP網絡和應用的迅猛發(fā)展,特別是隨著NGN網絡的逐步應用,該網絡可以提供包括話音、數(shù)據(jù)和多媒體等各種業(yè)務。語音質量測量是NGN網絡測試的一個重要方面,基于E-Model的語音質量測量是對NGN網絡語音質量測量的一種有效的方法,必定會有很好的應用前景。
參考文獻
1 朱海毅,周春楠.VoIP基本原理[J].信息技術.2003.5(5):83-84
2 吳耀文,王平.VoIP語音評價方法綜述[J].艦船電子工程.2006(1):44-46
3 ITU-T Recommendation P.800.1 .Mean Opinion Score(MOS)terminology.2003
4 ITU-T Recommendation G.107.The E-Model, a computational model for use in transmission planning.2003
5 TIA Telecommunications IP Telephony Equipment--Voice Quality Recommendations for IP Telephony.TSB-116-A.March 2006
6 Akira Takahashi and Hideaki Yoshino. Perceptual QoS Assessment Technologies for Vole IEEE Communications Magazine. July 2004:28-34
7 A.P. markopoulou, F.A. Tohagi, and M. Karam. Assessment of VoIP query over Internet backbones. IEEE, 2002.
作者:楊宗林 張治中 來源:廣東通信技術