VoIP是指通過IP網(wǎng)絡(luò)傳輸電話呼叫的一種方式。VoIP允許通過已有的IP數(shù)據(jù)網(wǎng)絡(luò)傳輸電話呼叫,從而幫助企業(yè)降低通信成本。同時VoIP技術(shù)在企業(yè)市場的應(yīng)用使數(shù)據(jù)通信產(chǎn)品廠商進(jìn)入了語音市場,激烈的競爭催生了很多新的應(yīng)用。在諸多新的應(yīng)用中,IP電話與企業(yè)數(shù)據(jù)以及桌面應(yīng)用的集成已成為一個熱點(diǎn),企業(yè)級IP電話的語音質(zhì)量對于整個融合解決方案的質(zhì)量至關(guān)重要。
影響語音質(zhì)量的因素
VoIP是以一種新技術(shù)的角色進(jìn)入市場,與傳統(tǒng)的PSTN網(wǎng)絡(luò)進(jìn)行競爭。作為替代技術(shù),其語音質(zhì)量應(yīng)該能夠與PSTN的語音質(zhì)量一致或者更好。但是因?yàn)镮P網(wǎng)絡(luò)原本不是為傳遞語音數(shù)據(jù)而設(shè)計(jì)的,相對傳統(tǒng)電話系統(tǒng),一些技術(shù)難點(diǎn)需要克服,設(shè)計(jì)者必須面對由此而帶來的挑戰(zhàn)。常見的問題有網(wǎng)絡(luò)時延、抖動、丟包和聲學(xué)回聲。
1. 網(wǎng)絡(luò)時延
在傳統(tǒng)的PSTN網(wǎng)絡(luò),洲際長話或者衛(wèi)星長話的回路時延大約在500~600ms,這時候,當(dāng)一方說話后要過一段時間對方才會聽到說話并反應(yīng),雙方通話脫節(jié)。在ITU的標(biāo)準(zhǔn)中建議電話系統(tǒng)的回路延時應(yīng)該不大于300ms。在IP電話系統(tǒng)中,回路的時延包括語音報(bào)文打包時長、語音編解碼所引入的延時以及處理網(wǎng)絡(luò)抖動所引入的延時等。系統(tǒng)設(shè)計(jì)者必須均衡考慮各方面因素,使系統(tǒng)的回路時延盡可能小,使通話自然流暢。
2. 抖動
IP報(bào)文在網(wǎng)絡(luò)上傳遞時,每個報(bào)文傳輸?shù)穆酚啥加锌赡懿灰粯,在每個節(jié)點(diǎn)上傳遞轉(zhuǎn)發(fā)的時間也可能不一樣。在一個VoIP通話中,每個語音數(shù)據(jù)報(bào)文在網(wǎng)絡(luò)中的傳輸時間都不一樣。一些報(bào)文會比預(yù)計(jì)到達(dá)的時間晚到或者早到接收方,而在回放解碼IP語音報(bào)文時,解碼器以固定間隔回放語音數(shù)據(jù)。晚到的語音包會導(dǎo)致在一段時間內(nèi)解碼器沒有數(shù)據(jù)可解,而早到的數(shù)據(jù)報(bào)文有可能被丟棄。所以系統(tǒng)中需要引入報(bào)文緩存區(qū)以去除網(wǎng)絡(luò)抖動,平滑網(wǎng)絡(luò)抖動所造成的影響。但是引入過深的緩存區(qū),會使回路時延相應(yīng)增大,需要選擇合適的緩存區(qū)大小,在能去除網(wǎng)絡(luò)抖動的同時,不過多增大回路延時。
3. 丟包
理想的網(wǎng)絡(luò)情況是所有發(fā)送的語音報(bào)文都能夠被接收端正常接收。但是IP報(bào)文在網(wǎng)絡(luò)上傳遞時,網(wǎng)絡(luò)的個別處理節(jié)點(diǎn)可能會出現(xiàn)處理能力不夠或者帶寬受限制的情況,部分報(bào)文可能會被丟掉。雖然IP網(wǎng)絡(luò)上有一些機(jī)制可以在報(bào)文丟失的時候重傳丟失報(bào)文,但是對實(shí)時性要求很高的話音數(shù)據(jù)并不能使用這些機(jī)制。
部分語音編解碼方式有內(nèi)置的丟包補(bǔ)償算法,在丟包比率不高的時候,可以使用插值的方法做補(bǔ)償,讓接聽方感覺不到語音信息丟失。但是在丟包率較高的網(wǎng)絡(luò),必須采用其它方法來控制網(wǎng)絡(luò)丟包對語音質(zhì)量的影響。
4. 聲學(xué)回聲
在電話二四線轉(zhuǎn)換系統(tǒng)中通常存在兩種回聲:線路回聲和聲學(xué)回聲。
線路回聲是由于二四線轉(zhuǎn)換的時候阻抗不匹配引起。在這種情況下,通話者的聲音傳遞到遠(yuǎn)端的二四線轉(zhuǎn)換時反射,同對方的說話送回到通話者的耳中。如果回路延時比較小(<50ms),通話者很難察覺到回聲的存在,但是當(dāng)回路時延比較大的時候,通話者就能聽到自己的說話。IP通話的回路時延一般比較大,所以在有二四現(xiàn)轉(zhuǎn)換的節(jié)點(diǎn)必須有回聲抑制單元。
聲學(xué)回聲是由于在電話側(cè)的播放和接聽之間存在聲學(xué)耦合,喇叭播放出的聲音經(jīng)過在空間中的一次或者多次反射以后回饋到聽筒或麥克風(fēng)而引起(如圖1所示)。
在企業(yè)級IP電話的設(shè)計(jì)中,因?yàn)镮P電話中沒有二四線轉(zhuǎn)換,所以線路回聲的影響不需要考慮。聲學(xué)回聲的影響,特別是免提模式下的聲學(xué)回聲是系統(tǒng)設(shè)計(jì)者需要考慮的難點(diǎn)和主要問題。
市場上推廣的很多解決方案宣稱能夠做到全雙工免提。但是事實(shí)上,大部分算法都只能支持半雙工免提通話。當(dāng)全雙工電話工作在免提模式下,通話的雙方即使同時說話也能聽到對方的聲音。如果是只能支持半雙工免提通話,當(dāng)雙方同時說話的時候,一方的聲音被壓制消除,不能被另一方聽到。甚至在本地的背景噪聲比較大的時候,對方的說話聲音被壓制,而聽不到任何聲音。
網(wǎng)絡(luò)時延、抖動、丟包以及聲學(xué)回聲都是影響IP電話通話質(zhì)量的重要因素,系統(tǒng)設(shè)計(jì)者必須妥善解決這些問題。芯片供應(yīng)商如果能夠提夠成熟的方案解決這些共性問題,可以使系統(tǒng)設(shè)計(jì)者集中精力設(shè)計(jì)差異化的新業(yè)務(wù),并縮短產(chǎn)品推向市場的時間。
TNETV1050 IP電話解決方案
TI提供全面的VoIP解決方案,覆蓋IP電話、家庭網(wǎng)關(guān)、電信級網(wǎng)關(guān)以及VoADSL和VoCable。針對企業(yè)級IP電話需求,TI提供了多種解決方案,其中TNETV1050/TNEV1055的SoC方案基于TI的TMS320C55x DSP系列的可編程DSP和增強(qiáng)的32位MIPS內(nèi)核。它使用先進(jìn)的系統(tǒng)架構(gòu),在提供高性能低功耗的同時,兼顧系統(tǒng)的可擴(kuò)展性,還包括豐富的外設(shè)接口,滿足設(shè)計(jì)企業(yè)級電話系統(tǒng)的要求。
圖2:TNETV1050/1055 IP電話處理器
TNETV1050芯片包含一個內(nèi)置的以太網(wǎng)交換機(jī)以及雙PHY,可以在桌面上提供IP電話服務(wù)的同時,提供一個PC連接。TNETV1050的USB接口可以使IP電話連接多種USB設(shè)備,如PDA等。設(shè)計(jì)者還可以通過TI的VLYNQ接口擴(kuò)展多種其他功能,例如Wi-Fi模塊,硬件加密等。芯片集成了LCD控制器、CODEC以及鍵盤接口,降低了系統(tǒng)成本。
TI的IP電話軟件套件包括了DSP核心算法和配套的CPU軟件包。完整的DSP軟件包括多種編解碼算法、VAD、聲學(xué)回聲消除算法、報(bào)文回放模塊,以及完全的統(tǒng)計(jì)調(diào)試信息功能和語音質(zhì)量監(jiān)控模塊。針對企業(yè)電話應(yīng)用,TI提供完整的聲學(xué)回聲消除模塊支持全雙工免提功能,同時支持本地三方會議功能以及寬帶編解碼算法。
CPU軟件工具包,包括TI的CPU軟件以及第三方的軟件模塊。其中包括控制DSP的API模塊、支持呼叫控制的模塊、加密框架模塊、協(xié)議棧接口,以及第三方的協(xié)議棧模塊。
TI的軟件和第三方的軟件一起提供了IP電話所需要的完整軟件解決方案,優(yōu)化的芯片解決方案和DSP/CPU軟件大大減少了系統(tǒng)設(shè)計(jì)時間。針對企業(yè)級IP電話設(shè)計(jì)中遇到的共性問題,TI的軟件提供系統(tǒng)的解決方法。
1. 抖動和時延的處理
針對抖動和時延問題,TI的DSP軟件做了相應(yīng)優(yōu)化,采用緊湊的系統(tǒng)結(jié)構(gòu),消除不必要的算法延遲。同時采用自適應(yīng)的去抖動緩存區(qū)的算法,可以計(jì)算網(wǎng)絡(luò)的實(shí)時抖動,并根據(jù)實(shí)時抖動大小來調(diào)整緩存區(qū)的深度。在網(wǎng)絡(luò)狀況良好的時候,如企業(yè)的本地局域網(wǎng)中,去抖動緩存區(qū)算法可以縮小緩存區(qū)深度,以減小回路延時。
2. 丟報(bào)的處理
TI的軟件包中包括主動和被動兩種丟包處理辦法。主動算法是在傳輸報(bào)文中加入冗余信息(RFC 2198)或者前向糾錯信息(RFC 2733)。這樣在回放端如果發(fā)現(xiàn)有報(bào)文丟失,就可以根據(jù)相應(yīng)的信息恢復(fù)出丟失的報(bào)文。當(dāng)丟失的報(bào)文無法用主動方法恢復(fù)的時候,可以用被動的方法去做補(bǔ)償,根據(jù)前面的語音信息,擬合出一段語音用來補(bǔ)償。
從圖3可以看到,在網(wǎng)絡(luò)丟包比較高的時候,使用主動干預(yù)仍然可以獲得比較好的語音質(zhì)量。
3. 聲學(xué)回聲的處理
解決IP電話的聲學(xué)回聲問題需要從兩方面著手。
首先,設(shè)計(jì)者需要采用有良好聲學(xué)特性的模具結(jié)構(gòu),以減小聲學(xué)回聲的幅度以及非線性回聲的部分。設(shè)計(jì)者可以通過咨詢相關(guān)的設(shè)計(jì)公司得到幫助。TI的方案包中包含聲學(xué)設(shè)計(jì)指南,對聲學(xué)設(shè)計(jì)中的一些要點(diǎn)提出建議。設(shè)計(jì)中的要點(diǎn)包括:盡可能增大喇叭到麥克風(fēng)的距離;麥克風(fēng)和喇叭在模具中應(yīng)該有聲學(xué)隔離;麥克風(fēng)應(yīng)用比較軟的海綿包住,然后固定到話機(jī)上,以減少從模具上傳遞過來的震動;話機(jī)在接觸桌面的部分使用減震的墊腳,以減少震動;選擇頻譜特性良好的喇叭和麥克風(fēng)等。
其次,聲學(xué)回聲處理模塊應(yīng)能夠良好地去除壓制聲學(xué)回聲,并能夠正確處理兩端講話(double-talk)和不損害背景噪聲連續(xù)性。TI的聲學(xué)回聲抑制模塊利用快速傅立葉變換,使用基于頻域算法,能夠快速收斂預(yù)測參數(shù),有效的檢測兩端講話。采用多級雙向非線性算法,同時在非線性算法工作的時候利用頻譜特征補(bǔ)償背景噪聲。
實(shí)時語音監(jiān)控方案——PIQUA
VoIP的一大難點(diǎn)是IP網(wǎng)絡(luò)的不確定性,而VoIP系統(tǒng)的語音質(zhì)量很大程度上倚賴于網(wǎng)絡(luò)質(zhì)量的好壞。網(wǎng)絡(luò)管理員需要一種實(shí)時監(jiān)控VoIP的質(zhì)量,主動干預(yù)網(wǎng)絡(luò)配置和VoIP的設(shè)置。
PIQUA是TI推出的實(shí)時語音監(jiān)控方案,它根據(jù)復(fù)雜的算法估算出用戶對VoIP系統(tǒng)語音質(zhì)量的主觀感覺并實(shí)時上報(bào),同時還提供重要的網(wǎng)絡(luò)統(tǒng)計(jì)信息。上層軟件和網(wǎng)絡(luò)管理員可以根據(jù)實(shí)時語音質(zhì)量以及統(tǒng)計(jì)信息對系統(tǒng)配置進(jìn)行干預(yù)。例如,當(dāng)某一段時間網(wǎng)絡(luò)的丟報(bào)率比較大,導(dǎo)致語音質(zhì)量下降的時候,系統(tǒng)管理軟件可以根據(jù)PIQUA的信息,配置不同等級的冗余或者前向糾錯來保證語音質(zhì)量。同時網(wǎng)絡(luò)管理員也可以根據(jù)PIQUA的記錄,了解整個網(wǎng)絡(luò)的狀況,找到丟包率較高的原因,調(diào)整路由表或者網(wǎng)絡(luò)帶寬分配,主動維護(hù)整個語音網(wǎng)絡(luò)的質(zhì)量。
來源:電子工程專輯