VoIP是指通過(guò)IP網(wǎng)絡(luò)傳輸電話(huà)呼叫的一種方式。VoIP允許通過(guò)已有的IP數(shù)據(jù)網(wǎng)絡(luò)傳輸電話(huà)呼叫,從而幫助企業(yè)降低通信成本。同時(shí)VoIP技術(shù)在企業(yè)市場(chǎng)的應(yīng)用使數(shù)據(jù)通信產(chǎn)品廠商進(jìn)入了語(yǔ)音市場(chǎng),激烈的競(jìng)爭(zhēng)催生了很多新的應(yīng)用。在諸多新的應(yīng)用中,IP電話(huà)與企業(yè)數(shù)據(jù)以及桌面應(yīng)用的集成已成為一個(gè)熱點(diǎn),企業(yè)級(jí)IP電話(huà)的語(yǔ)音質(zhì)量對(duì)于整個(gè)融合解決方案的質(zhì)量至關(guān)重要。
影響語(yǔ)音質(zhì)量的因素
VoIP是以一種新技術(shù)的角色進(jìn)入市場(chǎng),與傳統(tǒng)的PSTN網(wǎng)絡(luò)進(jìn)行競(jìng)爭(zhēng)。作為替代技術(shù),其語(yǔ)音質(zhì)量應(yīng)該能夠與PSTN的語(yǔ)音質(zhì)量一致或者更好。但是因?yàn)镮P網(wǎng)絡(luò)原本不是為傳遞語(yǔ)音數(shù)據(jù)而設(shè)計(jì)的,相對(duì)傳統(tǒng)電話(huà)系統(tǒng),一些技術(shù)難點(diǎn)需要克服,設(shè)計(jì)者必須面對(duì)由此而帶來(lái)的挑戰(zhàn)。常見(jiàn)的問(wèn)題有網(wǎng)絡(luò)時(shí)延、抖動(dòng)、丟包和聲學(xué)回聲。
1. 網(wǎng)絡(luò)時(shí)延
在傳統(tǒng)的PSTN網(wǎng)絡(luò),洲際長(zhǎng)話(huà)或者衛(wèi)星長(zhǎng)話(huà)的回路時(shí)延大約在500~600ms,這時(shí)候,當(dāng)一方說(shuō)話(huà)后要過(guò)一段時(shí)間對(duì)方才會(huì)聽(tīng)到說(shuō)話(huà)并反應(yīng),雙方通話(huà)脫節(jié)。在ITU的標(biāo)準(zhǔn)中建議電話(huà)系統(tǒng)的回路延時(shí)應(yīng)該不大于300ms。在IP電話(huà)系統(tǒng)中,回路的時(shí)延包括語(yǔ)音報(bào)文打包時(shí)長(zhǎng)、語(yǔ)音編解碼所引入的延時(shí)以及處理網(wǎng)絡(luò)抖動(dòng)所引入的延時(shí)等。系統(tǒng)設(shè)計(jì)者必須均衡考慮各方面因素,使系統(tǒng)的回路時(shí)延盡可能小,使通話(huà)自然流暢。
2. 抖動(dòng)
IP報(bào)文在網(wǎng)絡(luò)上傳遞時(shí),每個(gè)報(bào)文傳輸?shù)穆酚啥加锌赡懿灰粯樱诿總(gè)節(jié)點(diǎn)上傳遞轉(zhuǎn)發(fā)的時(shí)間也可能不一樣。在一個(gè)VoIP通話(huà)中,每個(gè)語(yǔ)音數(shù)據(jù)報(bào)文在網(wǎng)絡(luò)中的傳輸時(shí)間都不一樣。一些報(bào)文會(huì)比預(yù)計(jì)到達(dá)的時(shí)間晚到或者早到接收方,而在回放解碼IP語(yǔ)音報(bào)文時(shí),解碼器以固定間隔回放語(yǔ)音數(shù)據(jù)。晚到的語(yǔ)音包會(huì)導(dǎo)致在一段時(shí)間內(nèi)解碼器沒(méi)有數(shù)據(jù)可解,而早到的數(shù)據(jù)報(bào)文有可能被丟棄。所以系統(tǒng)中需要引入報(bào)文緩存區(qū)以去除網(wǎng)絡(luò)抖動(dòng),平滑網(wǎng)絡(luò)抖動(dòng)所造成的影響。但是引入過(guò)深的緩存區(qū),會(huì)使回路時(shí)延相應(yīng)增大,需要選擇合適的緩存區(qū)大小,在能去除網(wǎng)絡(luò)抖動(dòng)的同時(shí),不過(guò)多增大回路延時(shí)。
3. 丟包
理想的網(wǎng)絡(luò)情況是所有發(fā)送的語(yǔ)音報(bào)文都能夠被接收端正常接收。但是IP報(bào)文在網(wǎng)絡(luò)上傳遞時(shí),網(wǎng)絡(luò)的個(gè)別處理節(jié)點(diǎn)可能會(huì)出現(xiàn)處理能力不夠或者帶寬受限制的情況,部分報(bào)文可能會(huì)被丟掉。雖然IP網(wǎng)絡(luò)上有一些機(jī)制可以在報(bào)文丟失的時(shí)候重傳丟失報(bào)文,但是對(duì)實(shí)時(shí)性要求很高的話(huà)音數(shù)據(jù)并不能使用這些機(jī)制。
部分語(yǔ)音編解碼方式有內(nèi)置的丟包補(bǔ)償算法,在丟包比率不高的時(shí)候,可以使用插值的方法做補(bǔ)償,讓接聽(tīng)方感覺(jué)不到語(yǔ)音信息丟失。但是在丟包率較高的網(wǎng)絡(luò),必須采用其它方法來(lái)控制網(wǎng)絡(luò)丟包對(duì)語(yǔ)音質(zhì)量的影響。
4. 聲學(xué)回聲
在電話(huà)二四線(xiàn)轉(zhuǎn)換系統(tǒng)中通常存在兩種回聲:線(xiàn)路回聲和聲學(xué)回聲。
線(xiàn)路回聲是由于二四線(xiàn)轉(zhuǎn)換的時(shí)候阻抗不匹配引起。在這種情況下,通話(huà)者的聲音傳遞到遠(yuǎn)端的二四線(xiàn)轉(zhuǎn)換時(shí)反射,同對(duì)方的說(shuō)話(huà)送回到通話(huà)者的耳中。如果回路延時(shí)比較小(<50ms),通話(huà)者很難察覺(jué)到回聲的存在,但是當(dāng)回路時(shí)延比較大的時(shí)候,通話(huà)者就能聽(tīng)到自己的說(shuō)話(huà)。IP通話(huà)的回路時(shí)延一般比較大,所以在有二四現(xiàn)轉(zhuǎn)換的節(jié)點(diǎn)必須有回聲抑制單元。
聲學(xué)回聲是由于在電話(huà)側(cè)的播放和接聽(tīng)之間存在聲學(xué)耦合,喇叭播放出的聲音經(jīng)過(guò)在空間中的一次或者多次反射以后回饋到聽(tīng)筒或麥克風(fēng)而引起(如圖1所示)。
在企業(yè)級(jí)IP電話(huà)的設(shè)計(jì)中,因?yàn)镮P電話(huà)中沒(méi)有二四線(xiàn)轉(zhuǎn)換,所以線(xiàn)路回聲的影響不需要考慮。聲學(xué)回聲的影響,特別是免提模式下的聲學(xué)回聲是系統(tǒng)設(shè)計(jì)者需要考慮的難點(diǎn)和主要問(wèn)題。
市場(chǎng)上推廣的很多解決方案宣稱(chēng)能夠做到全雙工免提。但是事實(shí)上,大部分算法都只能支持半雙工免提通話(huà)。當(dāng)全雙工電話(huà)工作在免提模式下,通話(huà)的雙方即使同時(shí)說(shuō)話(huà)也能聽(tīng)到對(duì)方的聲音。如果是只能支持半雙工免提通話(huà),當(dāng)雙方同時(shí)說(shuō)話(huà)的時(shí)候,一方的聲音被壓制消除,不能被另一方聽(tīng)到。甚至在本地的背景噪聲比較大的時(shí)候,對(duì)方的說(shuō)話(huà)聲音被壓制,而聽(tīng)不到任何聲音。
網(wǎng)絡(luò)時(shí)延、抖動(dòng)、丟包以及聲學(xué)回聲都是影響IP電話(huà)通話(huà)質(zhì)量的重要因素,系統(tǒng)設(shè)計(jì)者必須妥善解決這些問(wèn)題。芯片供應(yīng)商如果能夠提夠成熟的方案解決這些共性問(wèn)題,可以使系統(tǒng)設(shè)計(jì)者集中精力設(shè)計(jì)差異化的新業(yè)務(wù),并縮短產(chǎn)品推向市場(chǎng)的時(shí)間。
TNETV1050 IP電話(huà)解決方案
TI提供全面的VoIP解決方案,覆蓋IP電話(huà)、家庭網(wǎng)關(guān)、電信級(jí)網(wǎng)關(guān)以及VoADSL和VoCable。針對(duì)企業(yè)級(jí)IP電話(huà)需求,TI提供了多種解決方案,其中TNETV1050/TNEV1055的SoC方案基于TI的TMS320C55x DSP系列的可編程DSP和增強(qiáng)的32位MIPS內(nèi)核。它使用先進(jìn)的系統(tǒng)架構(gòu),在提供高性能低功耗的同時(shí),兼顧系統(tǒng)的可擴(kuò)展性,還包括豐富的外設(shè)接口,滿(mǎn)足設(shè)計(jì)企業(yè)級(jí)電話(huà)系統(tǒng)的要求。
圖2:TNETV1050/1055 IP電話(huà)處理器
TNETV1050芯片包含一個(gè)內(nèi)置的以太網(wǎng)交換機(jī)以及雙PHY,可以在桌面上提供IP電話(huà)服務(wù)的同時(shí),提供一個(gè)PC連接。TNETV1050的USB接口可以使IP電話(huà)連接多種USB設(shè)備,如PDA等。設(shè)計(jì)者還可以通過(guò)TI的VLYNQ接口擴(kuò)展多種其他功能,例如Wi-Fi模塊,硬件加密等。芯片集成了LCD控制器、CODEC以及鍵盤(pán)接口,降低了系統(tǒng)成本。
TI的IP電話(huà)軟件套件包括了DSP核心算法和配套的CPU軟件包。完整的DSP軟件包括多種編解碼算法、VAD、聲學(xué)回聲消除算法、報(bào)文回放模塊,以及完全的統(tǒng)計(jì)調(diào)試信息功能和語(yǔ)音質(zhì)量監(jiān)控模塊。針對(duì)企業(yè)電話(huà)應(yīng)用,TI提供完整的聲學(xué)回聲消除模塊支持全雙工免提功能,同時(shí)支持本地三方會(huì)議功能以及寬帶編解碼算法。
CPU軟件工具包,包括TI的CPU軟件以及第三方的軟件模塊。其中包括控制DSP的API模塊、支持呼叫控制的模塊、加密框架模塊、協(xié)議棧接口,以及第三方的協(xié)議棧模塊。
TI的軟件和第三方的軟件一起提供了IP電話(huà)所需要的完整軟件解決方案,優(yōu)化的芯片解決方案和DSP/CPU軟件大大減少了系統(tǒng)設(shè)計(jì)時(shí)間。針對(duì)企業(yè)級(jí)IP電話(huà)設(shè)計(jì)中遇到的共性問(wèn)題,TI的軟件提供系統(tǒng)的解決方法。
1. 抖動(dòng)和時(shí)延的處理
針對(duì)抖動(dòng)和時(shí)延問(wèn)題,TI的DSP軟件做了相應(yīng)優(yōu)化,采用緊湊的系統(tǒng)結(jié)構(gòu),消除不必要的算法延遲。同時(shí)采用自適應(yīng)的去抖動(dòng)緩存區(qū)的算法,可以計(jì)算網(wǎng)絡(luò)的實(shí)時(shí)抖動(dòng),并根據(jù)實(shí)時(shí)抖動(dòng)大小來(lái)調(diào)整緩存區(qū)的深度。在網(wǎng)絡(luò)狀況良好的時(shí)候,如企業(yè)的本地局域網(wǎng)中,去抖動(dòng)緩存區(qū)算法可以縮小緩存區(qū)深度,以減小回路延時(shí)。
2. 丟報(bào)的處理
TI的軟件包中包括主動(dòng)和被動(dòng)兩種丟包處理辦法。主動(dòng)算法是在傳輸報(bào)文中加入冗余信息(RFC 2198)或者前向糾錯(cuò)信息(RFC 2733)。這樣在回放端如果發(fā)現(xiàn)有報(bào)文丟失,就可以根據(jù)相應(yīng)的信息恢復(fù)出丟失的報(bào)文。當(dāng)丟失的報(bào)文無(wú)法用主動(dòng)方法恢復(fù)的時(shí)候,可以用被動(dòng)的方法去做補(bǔ)償,根據(jù)前面的語(yǔ)音信息,擬合出一段語(yǔ)音用來(lái)補(bǔ)償。
從圖3可以看到,在網(wǎng)絡(luò)丟包比較高的時(shí)候,使用主動(dòng)干預(yù)仍然可以獲得比較好的語(yǔ)音質(zhì)量。
3. 聲學(xué)回聲的處理
解決IP電話(huà)的聲學(xué)回聲問(wèn)題需要從兩方面著手。
首先,設(shè)計(jì)者需要采用有良好聲學(xué)特性的模具結(jié)構(gòu),以減小聲學(xué)回聲的幅度以及非線(xiàn)性回聲的部分。設(shè)計(jì)者可以通過(guò)咨詢(xún)相關(guān)的設(shè)計(jì)公司得到幫助。TI的方案包中包含聲學(xué)設(shè)計(jì)指南,對(duì)聲學(xué)設(shè)計(jì)中的一些要點(diǎn)提出建議。設(shè)計(jì)中的要點(diǎn)包括:盡可能增大喇叭到麥克風(fēng)的距離;麥克風(fēng)和喇叭在模具中應(yīng)該有聲學(xué)隔離;麥克風(fēng)應(yīng)用比較軟的海綿包住,然后固定到話(huà)機(jī)上,以減少?gòu)哪>呱蟼鬟f過(guò)來(lái)的震動(dòng);話(huà)機(jī)在接觸桌面的部分使用減震的墊腳,以減少震動(dòng);選擇頻譜特性良好的喇叭和麥克風(fēng)等。
其次,聲學(xué)回聲處理模塊應(yīng)能夠良好地去除壓制聲學(xué)回聲,并能夠正確處理兩端講話(huà)(double-talk)和不損害背景噪聲連續(xù)性。TI的聲學(xué)回聲抑制模塊利用快速傅立葉變換,使用基于頻域算法,能夠快速收斂預(yù)測(cè)參數(shù),有效的檢測(cè)兩端講話(huà)。采用多級(jí)雙向非線(xiàn)性算法,同時(shí)在非線(xiàn)性算法工作的時(shí)候利用頻譜特征補(bǔ)償背景噪聲。
實(shí)時(shí)語(yǔ)音監(jiān)控方案——PIQUA
VoIP的一大難點(diǎn)是IP網(wǎng)絡(luò)的不確定性,而VoIP系統(tǒng)的語(yǔ)音質(zhì)量很大程度上倚賴(lài)于網(wǎng)絡(luò)質(zhì)量的好壞。網(wǎng)絡(luò)管理員需要一種實(shí)時(shí)監(jiān)控VoIP的質(zhì)量,主動(dòng)干預(yù)網(wǎng)絡(luò)配置和VoIP的設(shè)置。
PIQUA是TI推出的實(shí)時(shí)語(yǔ)音監(jiān)控方案,它根據(jù)復(fù)雜的算法估算出用戶(hù)對(duì)VoIP系統(tǒng)語(yǔ)音質(zhì)量的主觀感覺(jué)并實(shí)時(shí)上報(bào),同時(shí)還提供重要的網(wǎng)絡(luò)統(tǒng)計(jì)信息。上層軟件和網(wǎng)絡(luò)管理員可以根據(jù)實(shí)時(shí)語(yǔ)音質(zhì)量以及統(tǒng)計(jì)信息對(duì)系統(tǒng)配置進(jìn)行干預(yù)。例如,當(dāng)某一段時(shí)間網(wǎng)絡(luò)的丟報(bào)率比較大,導(dǎo)致語(yǔ)音質(zhì)量下降的時(shí)候,系統(tǒng)管理軟件可以根據(jù)PIQUA的信息,配置不同等級(jí)的冗余或者前向糾錯(cuò)來(lái)保證語(yǔ)音質(zhì)量。同時(shí)網(wǎng)絡(luò)管理員也可以根據(jù)PIQUA的記錄,了解整個(gè)網(wǎng)絡(luò)的狀況,找到丟包率較高的原因,調(diào)整路由表或者網(wǎng)絡(luò)帶寬分配,主動(dòng)維護(hù)整個(gè)語(yǔ)音網(wǎng)絡(luò)的質(zhì)量。
來(lái)源:電子工程專(zhuān)輯