Turbo碼是近年來通信系統(tǒng)糾錯編碼領(lǐng)域的重大突破,他以其接近Shannon限的優(yōu)越性能博得眾多學(xué)者的青睞。在第三代移動通信系統(tǒng)中,Turbo碼在各種標(biāo)準(zhǔn)中被普遍作為高速數(shù)據(jù)業(yè)務(wù)的信道編碼方式,如何實現(xiàn)高性能的Turbo碼譯碼器,成為第三代移動通信系統(tǒng)開發(fā)中接收機(jī)基帶處理部分的重點和難點之一。Turbo譯碼器中的分量譯碼器的實現(xiàn)算法有SOVA算法,Max-Log-Map算法和Log-Map算法,其中SOVA算法復(fù)雜度最低,性能最差;Log-Map算法性能最佳,復(fù)雜度最大,本文采用基于Max-Log-Map的優(yōu)化譯碼算法,對狀態(tài)量度歸一化計算和滑動窗算法等關(guān)鍵技術(shù)進(jìn)行優(yōu)化,在滿足性能要求的情況下,大大降低算法復(fù)雜度。
1 Turbo編碼器。譯碼器及算法
Turbo編碼器采用3GPP的編碼方案,由約束長度K為4,碼率為1/2的RSC編碼器通過1個交織器并行級聯(lián)而成,為提高性能對2個譯碼器分別附加3個尾比特使譯碼器的最終狀態(tài)為全0。
譯碼器采用反饋迭代結(jié)構(gòu),每級譯碼模塊除了交織器,解交織器外主要包括兩個級聯(lián)的分量譯碼器;一個分量譯碼器的輸出的軟判決信息經(jīng)過處理成為外信息輸入另一個分量譯碼器,形成迭代譯碼,在迭代一定級數(shù)后硬判決輸出。
編碼網(wǎng)格表貫穿整個譯碼過程,任意時刻k~k+1的RSC網(wǎng)格結(jié)構(gòu)如圖3所示,圖中編碼器輸入的0~7狀態(tài)可以由二進(jìn)制表示。
下面介紹Max-Log-Map算法。
由于需要進(jìn)行大量的乘法運算和指數(shù)運算,Map算法不適用于硬件實現(xiàn)。Erfanian和Pasupanthy最早提出了Map算法在對數(shù)域的簡化算*og-Map算法。通過轉(zhuǎn)換到對數(shù)域運算,避免了指數(shù)運算,同時乘法變成加法,而加法則變成Max運算,不過由此也會帶來了一定的性能損失。下面簡要描述Max-Log-Map算法。設(shè)Ak(s),Bk(s),Γk(s)分別代表對數(shù)域的前向狀態(tài)度量、后向狀態(tài)度量和分支度量,其表達(dá)式分別可表示為:
如圖3所示,每個節(jié)點狀態(tài)s都對應(yīng)于一個Ak(s),1個Bk(5)和2個Γk(s)。因此編碼網(wǎng)絡(luò)貫穿整個編譯碼過程,譯碼前要先按圖3建立網(wǎng)格映射表。
2譯碼器實現(xiàn)的關(guān)鍵改進(jìn)與優(yōu)化
Turbo碼譯碼是一個復(fù)雜的過程,之所以這么說,除了算法本身復(fù)雜外,還有兩個主要的原因,一個是遞推計算過程中前、反向度量不斷增大給信號處理器帶來的麻煩,即經(jīng)常說的溢出;另一個是大存儲量需求。這里,就這兩個細(xì)節(jié)問題進(jìn)行討論和總結(jié),并且給出詳細(xì)解決方案。
2.1狀態(tài)量度歸一化問題
由式(1),式(2)可注意到,隨著計算的不斷深入,狀態(tài)量度值不斷增加,為防止計算溢出和減小硬件復(fù)雜度,必須對其進(jìn)行歸一化處理。一種方法是減去前一時刻狀態(tài)度量的最小值,這種方法在每個時刻都需要減法器和用于計算最小值的比較器,當(dāng)狀態(tài)數(shù)較多時,由此帶來的額外的時延和硬件消耗是不能忽略的。本算法采用一種十分有效的歸一化方法(以Ak(s)為例),在每個計算時刻,判斷有沒有狀態(tài)度量值(A或B)大于某一門限值T,若有則所有節(jié)點的狀態(tài)度量值(A或B)都減去T,若沒有則保持原值不變。這樣便大大減少了減法器使用的次數(shù),也無需計算最小值。由于所有的節(jié)點都減去了相同的值,因此式(5)的結(jié)果不會受到影響。T值不宜設(shè)置太大,但設(shè)置得太小,歸一化發(fā)生的很頻繁,會增加譯碼時延和硬件開銷。通過試驗仿真,若q代表狀態(tài)量度值的量化字長,則T設(shè)為2q-2為合適。
2.2 引入滑動窗減小存儲量 由于Turbo碼譯碼算法的迭代特性,每一級Map譯碼器需要大量存儲器。在譯碼時引入滑動窗,能有效減少所需的存儲量。采用滑動窗的Map譯碼步驟為:每次譯碼過程被分為若干段以間隔L(假設(shè)滑動窗的長度為L,L《N)連續(xù)進(jìn)行,只需在對nL長的數(shù)據(jù)進(jìn)行前向處理后,每個反向子處理過程即可執(zhí)行,而未使用滑動窗時,需要對整個數(shù)據(jù)塊處理后才能進(jìn)行。實驗證明,滑動窗大小選擇7~8倍的約束長度時對誤碼率的性能影響幾乎可以忽略。本算法中約束長度為4,選擇窗口大小為32。下面給出采用滑動窗譯碼前后兩種算法存儲空間分配情況的比較。假設(shè)編碼幀長為L,B表示窗口長度,L為B的整數(shù)倍。
按照表1,這個存儲空間為26L,當(dāng)L=1K時,為26K。如果我們采用分塊譯碼,按照表2,那么整個譯碼的存儲需求為20B+8L,B一般取編碼約束長度的5~10倍,對于8狀態(tài)編碼,取B=32,那么這個存儲空間為640+8L,與表1的26L相比要小的多。
當(dāng)L=1K時,存儲空間只占原來的33.2%。當(dāng)編碼幀長L的取更大值時,存儲空間的節(jié)約更加可觀,比較得知采用滑動窗后,Turbo譯碼能夠大大節(jié)省硬件的存儲資源。