詞語解釋
H.264是一種視頻壓縮標(biāo)準,它是由MPEG-4 Part 10標(biāo)準的一個子集,也稱為MPEG-4 AVC(Advanced Video Coding)。它是一種無損編碼標(biāo)準,可以有效地將視頻文件的大小減小,同時保持視頻質(zhì)量。H.264的優(yōu)勢在于它可以提供更高的壓縮比,比傳統(tǒng)的MPEG-2標(biāo)準更有效地壓縮視頻文件。 H.264在通信中的應(yīng)用主要是用于實時視頻傳輸,它可以有效地減少視頻文件的大小,從而使傳輸速度更快,節(jié)省帶寬。它還可以提供更高的圖像質(zhì)量,使視頻更清晰,更加逼真。此外,H.264還可以支持多種編碼格式,如H.264、H.265、AVC、MPEG-4等,可以滿足不同的編碼要求。 H.264在視頻會議、視頻監(jiān)控、遠程教育、視頻點播等領(lǐng)域有廣泛的應(yīng)用。它可以提供更高的壓縮比,使視頻文件的大小變得更小,從而減少傳輸時間,提高傳輸效率。此外,H.264還可以支持多種視頻格式,可以滿足不同的視頻編碼要求。 總之,H.264在通信中的應(yīng)用是非常廣泛的,它可以有效地減少視頻文件的大小,提高傳輸速度,提供更高的圖像質(zhì)量,支持多種編碼格式,使視頻傳輸更加高效。 隨著HDTV的興起,H.264這個規(guī)范頻頻出現(xiàn)在我們眼前,HD-DVD和藍光DVD均計劃采用這一標(biāo)準進行節(jié)目制作。而且自2005年下半年以來,無論是NVIDIA還是ATI都把支持H.264硬件解碼加速作為自己最值得夸耀的視頻技術(shù)。H.264到底是何方“神圣”呢? 什么是H.264?H.264是一種高性能的視頻編解碼技術(shù)。目前國際上制定視頻編解碼技術(shù)的組織有兩個,一個是“國際電聯(lián)(ITU-T)”,它制定的標(biāo)準有H.261、H.263、H.263+等,另一個是“國際標(biāo)準化組織(ISO)”它制定的標(biāo)準有MPEG-1、MPEG-2、MPEG-4等。而H.264則是由兩個組織聯(lián)合組建的聯(lián)合視頻組(JVT)共同制定的新數(shù)字視頻編碼標(biāo)準,所以它既是ITU-T的H.264,又是ISO/IEC的MPEG-4高級視頻編碼(Advanced Video Coding,AVC),而且它將成為MPEG-4標(biāo)準的第10部分。因此,不論是MPEG-4 AVC、MPEG-4 Part 10,還是ISO/IEC 14496-10,都是指H.264。 H.264最大的優(yōu)勢是具有很高的數(shù)據(jù)壓縮比率,在同等圖像質(zhì)量的條件下,H.264的壓縮比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。舉個例子,原始文件的大小如果為88GB,采用MPEG-2壓縮標(biāo)準壓縮后變成3.5GB,壓縮比為25∶1,而采用H.264壓縮標(biāo)準壓縮后變?yōu)?79MB,從88GB到879MB,H.264的壓縮比達到驚人的102∶1!H.264為什么有那么高的壓縮比?低碼率(Low Bit Rate)起了重要的作用,和MPEG-2和MPEG-4 ASP等壓縮技術(shù)相比,H.264壓縮技術(shù)將大大節(jié)省用戶的下載時間和數(shù)據(jù)流量收費。尤其值得一提的是,H.264在具有高壓縮比的同時還擁有高質(zhì)量流暢的圖像。 H.264算法的優(yōu)勢 H.264是在MPEG-4技術(shù)的基礎(chǔ)之上建立起來的,其編解碼流程主要包括5個部分:幀間和幀內(nèi)預(yù)測(Estimation)、變換(Transform)和反變換、量化(Quantization)和反量化、環(huán)路濾波(Loop Filter)、熵編碼(Entropy Coding)。 H.264/MPEG-4 AVC(H.264)是1995年自MPEG-2視頻壓縮標(biāo)準發(fā)布以后的最新、最有前途的視頻壓縮標(biāo)準。H.264是由ITU-T和ISO/IEC的聯(lián)合開發(fā)組共同開發(fā)的最新國際視頻編碼標(biāo)準。通過該標(biāo)準,在同等圖象質(zhì)量下的壓縮效率比以前的標(biāo)準提高了2倍以上,因此,H.264被普遍認為是最有影響力的行業(yè)標(biāo)準。 一、H.264的發(fā)展歷史 H.264在1997年ITU的視頻編碼專家組(Video Coding Experts Group)提出時被稱為H.26L,在ITU與ISO合作研究后被稱為MPEG4 Part10(MPEG4 AVC)或H.264(JVT)。 H.264的高級技術(shù)背景 H.264標(biāo)準的主要目標(biāo)是:與其它現(xiàn)有的視頻編碼標(biāo)準相比,在相同的帶寬下提供更加優(yōu)秀的圖象質(zhì)量。 而,H.264與以前的國際標(biāo)準如H.263和MPEG-4相比,最大的優(yōu)勢體現(xiàn)在以下四個方面: 1. 將每個視頻幀分離成由像素組成的塊,因此視頻幀的編碼處理的過程可以達到塊的級別。 2. 采用空間冗余的方法,對視頻幀的一些原始塊進行空間預(yù)測、轉(zhuǎn)換、優(yōu)化和熵編碼(可變長編碼)。 3. 對連續(xù)幀的不同塊采用臨時存放的方法,這樣,只需對連續(xù)幀中有改變的部分進行編碼。該算法采用運動預(yù)測和運動補償來完成。對某些特定的塊,在一個或多個已經(jīng)進行了編碼的幀執(zhí)行搜索來決定塊的運動向量,并由此在后面的編碼和解碼中預(yù)測主塊。 4. 采用剩余空間冗余技術(shù),對視頻幀里的殘留塊進行編碼。例如:對于源塊和相應(yīng)預(yù)測塊的不同,再次采用轉(zhuǎn)換、優(yōu)化和熵編碼。 H.264的特征和高級優(yōu)勢 H.264是國際標(biāo)準化組織(ISO)和國際電信聯(lián)盟(ITU)共同提出的繼MPEG4之后的新一代數(shù)字視頻壓縮格式,它即保留了以往壓縮技術(shù)的優(yōu)點和精華又具有其他壓縮技術(shù)無法比擬的許多優(yōu)點。 1.低碼流(Low Bit Rate):和MPEG2和MPEG4 ASP等壓縮技術(shù)相比,在同等圖像質(zhì)量下,采用H.264技術(shù)壓縮后的數(shù)據(jù)量只有MPEG2的1/8,MPEG4的1/3。 顯然,H.264壓縮技術(shù)的采用將大大節(jié)省用戶的下載時間和數(shù)據(jù)流量收費。 2.高質(zhì)量的圖象:H.264能提供連續(xù)、流暢的高質(zhì)量圖象(DVD質(zhì)量)。 3.容錯能力強:H.264提供了解決在不穩(wěn)定網(wǎng)絡(luò)環(huán)境下容易發(fā)生的丟包等錯誤的必要工具。 4.網(wǎng)絡(luò)適應(yīng)性強:H.264提供了網(wǎng)絡(luò)適應(yīng)層(Network Adaptation Layer), 使得H.264的文件能容易地在不同網(wǎng)絡(luò)上傳輸(例如互聯(lián)網(wǎng),CDMA,GPRS,WCDMA,CDMA2000等)。 二、H.264標(biāo)準概述 H.264和以前的標(biāo)準一樣,也是DPCM加變換編碼的混合編碼模式。但它采用“回歸基本”的簡潔設(shè)計,不用眾多的選項,獲得比H.263++好得多的壓縮性能;加強了對各種信道的適應(yīng)能力,采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語法,有利于對誤碼和丟包的處理;應(yīng)用目標(biāo)范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求。 技術(shù)上,它集中了以往標(biāo)準的優(yōu)點,并吸收了標(biāo)準制定中積累的經(jīng)驗。與H.263 v2(H.263+)或MPEG-4簡單類(Simple Profile)相比,H.264在使用與上述編碼方法類似的最佳編碼器時,在大多數(shù)碼率下最多可節(jié)省50%的碼率。H.264在所有碼率下都能持續(xù)提供較高的視頻質(zhì)量。H.264能工作在低延時模式以適應(yīng)實時通信的應(yīng)用(如視頻會議),同時又能很好地工作在沒有延時限制的應(yīng)用,如視頻存儲和以服務(wù)器為基礎(chǔ)的視頻流式應(yīng)用。H.264提供包傳輸網(wǎng)中處理包丟失所需的工具,以及在易誤碼的無線網(wǎng)中處理比特誤碼的工具。 在系統(tǒng)層面上,H.264提出了一個新的概念,在視頻編碼層(Video Coding Layer, VCL)和網(wǎng)絡(luò)提取層(Network Abstraction Layer, NAL)之間進行概念性分割,前者是視頻內(nèi)容的核心壓縮內(nèi)容之表述,后者是通過特定類型網(wǎng)絡(luò)進行遞送的表述,這樣的結(jié)構(gòu)便于信息的封裝和對信息進行更好的優(yōu)先級控制。H.264的系統(tǒng)編碼框圖如圖1所示。 圖1 H.264系統(tǒng)框圖 三、H.264標(biāo)準的關(guān)鍵技術(shù) 1.幀內(nèi)預(yù)測編碼 幀內(nèi)編碼用來縮減圖像的空間冗余。為了提高H.264幀內(nèi)編碼的效率,在給定幀中充分利用相鄰宏塊的空間相關(guān)性,相鄰的宏塊通常含有相似的屬性。因此,在對一給定宏塊編碼時,首先可以根據(jù)周圍的宏塊預(yù)測(典型的是根據(jù)左上角的宏塊,因為此宏塊已經(jīng)被編碼處理),然后對預(yù)測值與實際值的差值進行編碼,這樣,相對于直接對該幀編碼而言,可以大大減小碼率。 H.264提供6種模式進行4×4像素宏塊預(yù)測,包括1種直流預(yù)測和5種方向預(yù)測,如圖2所示。在圖中,相鄰塊的A到I共9個像素均已經(jīng)被編碼,可以被用以預(yù)測,如果我們選擇模式4,那么,a、b、c、d4個像素被預(yù)測為與E相等的值,e、f、g、h4個像素被預(yù)測為與F相等的值,對于圖像中含有很少空間信息的平坦區(qū),H.264也支持16×16的幀內(nèi)編碼。 圖2 幀內(nèi)編碼模式 2.幀間預(yù)測編碼 幀間預(yù)測編碼利用連續(xù)幀中的時間冗余來進行運動估計和補償。H.264的運動補償支持以往的視頻編碼標(biāo)準中的大部分關(guān)鍵特性,而且靈活地添加了更多的功能,除了支持P幀、B幀外,H.264還支持一種新的流間傳送幀——SP幀,如圖3所示。碼流中包含SP幀后,能在有類似內(nèi)容但有不同碼率的碼流之間快速切換,同時支持隨機接入和快速回放模式。圖3 SP-幀示意圖H.264的運動估計有以下4個特性。 (1)不同大小和形狀的宏塊分割 對每一個16×16像素宏塊的運動補償可以采用不同的大小和形狀,H.264支持7種模式,如圖4所示。小塊模式的運動補償為運動詳細信息的處理提高了性能,減少了方塊效應(yīng),提高了圖像的質(zhì)量。圖4 宏塊分割方法 (2)高精度的亞像素運動補償 在H.263中采用的是半像素精度的運動估計,而在H.264中可以采用1/4或者1/8像素精度的運動估值。在要求相同精度的情況下,H.264使用1/4或者1/8像素精度的運動估計后的殘差要比H.263采用半像素精度運動估計后的殘差來得小。這樣在相同精度下,H.264在幀間編碼中所需的碼率更小。 (3)多幀預(yù)測 H.264提供可選的多幀預(yù)測功能,在幀間編碼時,可選5個不同的參考幀,提供了更好的糾錯性能,這樣更可以改善視頻圖像質(zhì)量。這一特性主要應(yīng)用于以下場合:周期性的運動、平移運動、在兩個不同的場景之間來回變換攝像機的鏡頭。 (4)去塊濾波器 H.264定義了自適應(yīng)去除塊效應(yīng)的濾波器,這可以處理預(yù)測環(huán)路中的水平和垂直塊邊緣,大大減少了方塊效應(yīng)。 3.整數(shù)變換 在變換方面,H.264使用了基于4×4像素塊的類似于DCT的變換,但使用的是以整數(shù)為基礎(chǔ)的空間變換,不存在反變換,因為取舍而存在誤差的問題,變換矩陣如圖5所示。與浮點運算相比,整數(shù)DCT變換會引起一些額外的誤差,但因為DCT變換后的量化也存在量化誤差,與之相比,整數(shù)DCT變換引起的量化誤差影響并不大。此外,整數(shù)DCT變換還具有減少運算量和復(fù)雜度,有利于向定點DSP移植的優(yōu)點。 4.量化 H.264中可選32種不同的量化步長,這與H.263中有31個量化步長很相似,但是在H.264中,步長是以12.5%的復(fù)合率遞進的,而不是一個固定常數(shù)。 在H.264中,變換系數(shù)的讀出方式也有兩種:之字形(Zigzag)掃描和雙掃描,如圖6所示。大多數(shù)情況下使用簡單的之字形掃描;雙掃描僅用于使用較小量化級的塊內(nèi),有助于提高編碼效率。圖6 變換系數(shù)的讀出方式 5.熵編碼 視頻編碼處理的最后一步就是熵編碼,在H.264中采用了兩種不同的熵編碼方法:通用可變長編碼(UVLC)和基于文本的自適應(yīng)二進制算術(shù)編碼(CABAC)。 在H.263等標(biāo)準中,根據(jù)要編碼的數(shù)據(jù)類型如變換系數(shù)、運動矢量等,采用不同的VLC碼表。H.264中的UVLC碼表提供了一個簡單的方法,不管符號表述什么類型的數(shù)據(jù),都使用統(tǒng)一變字長編碼表。其優(yōu)點是簡單;缺點是單一的碼表是從概率統(tǒng)計分布模型得出的,沒有考慮編碼符號間的相關(guān)性,在中高碼率時效果不是很好。 因此,H.264中還提供了可選的CABAC方法。算術(shù)編碼使編碼和解碼兩邊都能使用所有句法元素(變換系數(shù)、運動矢量)的概率模型。為了提高算術(shù)編碼的效率,通過內(nèi)容建模的過程,使基本概率模型能適應(yīng)隨視頻幀而改變的統(tǒng)計特性。內(nèi)容建模提供了編碼符號的條件概率估計,利用合適的內(nèi)容模型,存在于符號間的相關(guān)性可以通過選擇目前要編碼符號鄰近的已編碼符號的相應(yīng)概率模型來去除,不同的句法元素通常保持不同的模型。 四、H.264在視頻會議中的應(yīng)用 目前,大多數(shù)的視頻會議系統(tǒng)均采用H.261或H.263視頻編碼標(biāo)準,而H.264的出現(xiàn),使得在同等速率下,H.264能夠比H.263減小50%的碼率。也就是說,用戶即使是只利用 384kbit/s的帶寬,就可以享受H.263下高達 768kbit/s的高質(zhì)量視頻服務(wù)。H.264 不但有助于節(jié)省龐大開支,還可以提高資源的使用效率,同時令達到商業(yè)質(zhì)量的視頻會議服務(wù)擁有更多的潛在客戶。 目前,已經(jīng)有少數(shù)幾家廠商的視頻會議產(chǎn)品支持H.264協(xié)議,廠商們致力于普及H.264這個全新的業(yè)界標(biāo)準。隨著其它視頻會議方案廠商陸續(xù)效仿他們的做法,我們必將能全面體驗H.264視頻服務(wù)的優(yōu)勢。
隨著HDTV的興起,H.264這個規(guī)范頻頻出現(xiàn)在我們眼前,HD-DVD和藍光DVD均計劃采用這一標(biāo)準進行節(jié)目制作。而且自2005年下半年以來,無論是NVIDIA還是ATI都把支持H.264硬件解碼加速作為自己最值得夸耀的視頻技術(shù)。H.264到底是何方“神圣”呢? 什么是H.264?H.264是一種高性能的視頻編解碼技術(shù)。目前國際上制定視頻編解碼技術(shù)的組織有兩個,一個是“國際電聯(lián)(ITU-T)”,它制定的標(biāo)準有H.261、H.263、H.263+等,另一個是“國際標(biāo)準化組織(ISO)”它制定的標(biāo)準有MPEG-1、MPEG-2、MPEG-4等。而H.264則是由兩個組織聯(lián)合組建的聯(lián)合視頻組(JVT)共同制定的新數(shù)字視頻編碼標(biāo)準,所以它既是ITU-T的H.264,又是ISO/IEC的MPEG-4高級視頻編碼(Advanced Video Coding,AVC),而且它將成為MPEG-4標(biāo)準的第10部分。因此,不論是MPEG-4 AVC、MPEG-4 Part 10,還是ISO/IEC 14496-10,都是指H.264。 H.264最大的優(yōu)勢是具有很高的數(shù)據(jù)壓縮比率,在同等圖像質(zhì)量的條件下,H.264的壓縮比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。舉個例子,原始文件的大小如果為88GB,采用MPEG-2壓縮標(biāo)準壓縮后變成3.5GB,壓縮比為25∶1,而采用H.264壓縮標(biāo)準壓縮后變?yōu)?79MB,從88GB到879MB,H.264的壓縮比達到驚人的102∶1!H.264為什么有那么高的壓縮比?低碼率(Low Bit Rate)起了重要的作用,和MPEG-2和MPEG-4 ASP等壓縮技術(shù)相比,H.264壓縮技術(shù)將大大節(jié)省用戶的下載時間和數(shù)據(jù)流量收費。尤其值得一提的是,H.264在具有高壓縮比的同時還擁有高質(zhì)量流暢的圖像。 H.264算法的優(yōu)勢 H.264是在MPEG-4技術(shù)的基礎(chǔ)之上建立起來的,其編解碼流程主要包括5個部分:幀間和幀內(nèi)預(yù)測(Estimation)、變換(Transform)和反變換、量化(Quantization)和反量化、環(huán)路濾波(Loop Filter)、熵編碼(Entropy Coding)。 H.264/MPEG-4 AVC(H.264)是1995年自MPEG-2視頻壓縮標(biāo)準發(fā)布以后的最新、最有前途的視頻壓縮標(biāo)準。H.264是由ITU-T和ISO/IEC的聯(lián)合開發(fā)組共同開發(fā)的最新國際視頻編碼標(biāo)準。通過該標(biāo)準,在同等圖象質(zhì)量下的壓縮效率比以前的標(biāo)準提高了2倍以上,因此,H.264被普遍認為是最有影響力的行業(yè)標(biāo)準。 一、H.264的發(fā)展歷史 H.264在1997年ITU的視頻編碼專家組(Video Coding Experts Group)提出時被稱為H.26L,在ITU與ISO合作研究后被稱為MPEG4 Part10(MPEG4 AVC)或H.264(JVT)。 H.264的高級技術(shù)背景 H.264標(biāo)準的主要目標(biāo)是:與其它現(xiàn)有的視頻編碼標(biāo)準相比,在相同的帶寬下提供更加優(yōu)秀的圖象質(zhì)量。 而,H.264與以前的國際標(biāo)準如H.263和MPEG-4相比,最大的優(yōu)勢體現(xiàn)在以下四個方面: 1. 將每個視頻幀分離成由像素組成的塊,因此視頻幀的編碼處理的過程可以達到塊的級別。 2. 采用空間冗余的方法,對視頻幀的一些原始塊進行空間預(yù)測、轉(zhuǎn)換、優(yōu)化和熵編碼(可變長編碼)。 3. 對連續(xù)幀的不同塊采用臨時存放的方法,這樣,只需對連續(xù)幀中有改變的部分進行編碼。該算法采用運動預(yù)測和運動補償來完成。對某些特定的塊,在一個或多個已經(jīng)進行了編碼的幀執(zhí)行搜索來決定塊的運動向量,并由此在后面的編碼和解碼中預(yù)測主塊。 4. 采用剩余空間冗余技術(shù),對視頻幀里的殘留塊進行編碼。例如:對于源塊和相應(yīng)預(yù)測塊的不同,再次采用轉(zhuǎn)換、優(yōu)化和熵編碼。 H.264的特征和高級優(yōu)勢 H.264是國際標(biāo)準化組織(ISO)和國際電信聯(lián)盟(ITU)共同提出的繼MPEG4之后的新一代數(shù)字視頻壓縮格式,它即保留了以往壓縮技術(shù)的優(yōu)點和精華又具有其他壓縮技術(shù)無法比擬的許多優(yōu)點。 1.低碼流(Low Bit Rate):和MPEG2和MPEG4 ASP等壓縮技術(shù)相比,在同等圖像質(zhì)量下,采用H.264技術(shù)壓縮后的數(shù)據(jù)量只有MPEG2的1/8,MPEG4的1/3。 顯然,H.264壓縮技術(shù)的采用將大大節(jié)省用戶的下載時間和數(shù)據(jù)流量收費。 2.高質(zhì)量的圖象:H.264能提供連續(xù)、流暢的高質(zhì)量圖象(DVD質(zhì)量)。 3.容錯能力強:H.264提供了解決在不穩(wěn)定網(wǎng)絡(luò)環(huán)境下容易發(fā)生的丟包等錯誤的必要工具。 4.網(wǎng)絡(luò)適應(yīng)性強:H.264提供了網(wǎng)絡(luò)適應(yīng)層(Network Adaptation Layer), 使得H.264的文件能容易地在不同網(wǎng)絡(luò)上傳輸(例如互聯(lián)網(wǎng),CDMA,GPRS,WCDMA,CDMA2000等)。 二、H.264標(biāo)準概述 H.264和以前的標(biāo)準一樣,也是DPCM加變換編碼的混合編碼模式。但它采用“回歸基本”的簡潔設(shè)計,不用眾多的選項,獲得比H.263++好得多的壓縮性能;加強了對各種信道的適應(yīng)能力,采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語法,有利于對誤碼和丟包的處理;應(yīng)用目標(biāo)范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求。 技術(shù)上,它集中了以往標(biāo)準的優(yōu)點,并吸收了標(biāo)準制定中積累的經(jīng)驗。與H.263 v2(H.263+)或MPEG-4簡單類(Simple Profile)相比,H.264在使用與上述編碼方法類似的最佳編碼器時,在大多數(shù)碼率下最多可節(jié)省50%的碼率。H.264在所有碼率下都能持續(xù)提供較高的視頻質(zhì)量。H.264能工作在低延時模式以適應(yīng)實時通信的應(yīng)用(如視頻會議),同時又能很好地工作在沒有延時限制的應(yīng)用,如視頻存儲和以服務(wù)器為基礎(chǔ)的視頻流式應(yīng)用。H.264提供包傳輸網(wǎng)中處理包丟失所需的工具,以及在易誤碼的無線網(wǎng)中處理比特誤碼的工具。 在系統(tǒng)層面上,H.264提出了一個新的概念,在視頻編碼層(Video Coding Layer, VCL)和網(wǎng)絡(luò)提取層(Network Abstraction Layer, NAL)之間進行概念性分割,前者是視頻內(nèi)容的核心壓縮內(nèi)容之表述,后者是通過特定類型網(wǎng)絡(luò)進行遞送的表述,這樣的結(jié)構(gòu)便于信息的封裝和對信息進行更好的優(yōu)先級控制。H.264的系統(tǒng)編碼框圖如圖1所示。 圖1 H.264系統(tǒng)框圖 三、H.264標(biāo)準的關(guān)鍵技術(shù) 1.幀內(nèi)預(yù)測編碼 幀內(nèi)編碼用來縮減圖像的空間冗余。為了提高H.264幀內(nèi)編碼的效率,在給定幀中充分利用相鄰宏塊的空間相關(guān)性,相鄰的宏塊通常含有相似的屬性。因此,在對一給定宏塊編碼時,首先可以根據(jù)周圍的宏塊預(yù)測(典型的是根據(jù)左上角的宏塊,因為此宏塊已經(jīng)被編碼處理),然后對預(yù)測值與實際值的差值進行編碼,這樣,相對于直接對該幀編碼而言,可以大大減小碼率。 H.264提供6種模式進行4×4像素宏塊預(yù)測,包括1種直流預(yù)測和5種方向預(yù)測,如圖2所示。在圖中,相鄰塊的A到I共9個像素均已經(jīng)被編碼,可以被用以預(yù)測,如果我們選擇模式4,那么,a、b、c、d4個像素被預(yù)測為與E相等的值,e、f、g、h4個像素被預(yù)測為與F相等的值,對于圖像中含有很少空間信息的平坦區(qū),H.264也支持16×16的幀內(nèi)編碼。 圖2 幀內(nèi)編碼模式 2.幀間預(yù)測編碼 幀間預(yù)測編碼利用連續(xù)幀中的時間冗余來進行運動估計和補償。H.264的運動補償支持以往的視頻編碼標(biāo)準中的大部分關(guān)鍵特性,而且靈活地添加了更多的功能,除了支持P幀、B幀外,H.264還支持一種新的流間傳送幀——SP幀,如圖3所示。碼流中包含SP幀后,能在有類似內(nèi)容但有不同碼率的碼流之間快速切換,同時支持隨機接入和快速回放模式。圖3 SP-幀示意圖H.264的運動估計有以下4個特性。 (1)不同大小和形狀的宏塊分割 對每一個16×16像素宏塊的運動補償可以采用不同的大小和形狀,H.264支持7種模式,如圖4所示。小塊模式的運動補償為運動詳細信息的處理提高了性能,減少了方塊效應(yīng),提高了圖像的質(zhì)量。圖4 宏塊分割方法 (2)高精度的亞像素運動補償 在H.263中采用的是半像素精度的運動估計,而在H.264中可以采用1/4或者1/8像素精度的運動估值。在要求相同精度的情況下,H.264使用1/4或者1/8像素精度的運動估計后的殘差要比H.263采用半像素精度運動估計后的殘差來得小。這樣在相同精度下,H.264在幀間編碼中所需的碼率更小。 (3)多幀預(yù)測 H.264提供可選的多幀預(yù)測功能,在幀間編碼時,可選5個不同的參考幀,提供了更好的糾錯性能,這樣更可以改善視頻圖像質(zhì)量。這一特性主要應(yīng)用于以下場合:周期性的運動、平移運動、在兩個不同的場景之間來回變換攝像機的鏡頭。 (4)去塊濾波器 H.264定義了自適應(yīng)去除塊效應(yīng)的濾波器,這可以處理預(yù)測環(huán)路中的水平和垂直塊邊緣,大大減少了方塊效應(yīng)。 3.整數(shù)變換 在變換方面,H.264使用了基于4×4像素塊的類似于DCT的變換,但使用的是以整數(shù)為基礎(chǔ)的空間變換,不存在反變換,因為取舍而存在誤差的問題,變換矩陣如圖5所示。與浮點運算相比,整數(shù)DCT變換會引起一些額外的誤差,但因為DCT變換后的量化也存在量化誤差,與之相比,整數(shù)DCT變換引起的量化誤差影響并不大。此外,整數(shù)DCT變換還具有減少運算量和復(fù)雜度,有利于向定點DSP移植的優(yōu)點。 4.量化 H.264中可選32種不同的量化步長,這與H.263中有31個量化步長很相似,但是在H.264中,步長是以12.5%的復(fù)合率遞進的,而不是一個固定常數(shù)。 在H.264中,變換系數(shù)的讀出方式也有兩種:之字形(Zigzag)掃描和雙掃描,如圖6所示。大多數(shù)情況下使用簡單的之字形掃描;雙掃描僅用于使用較小量化級的塊內(nèi),有助于提高編碼效率。圖6 變換系數(shù)的讀出方式 5.熵編碼 視頻編碼處理的最后一步就是熵編碼,在H.264中采用了兩種不同的熵編碼方法:通用可變長編碼(UVLC)和基于文本的自適應(yīng)二進制算術(shù)編碼(CABAC)。 在H.263等標(biāo)準中,根據(jù)要編碼的數(shù)據(jù)類型如變換系數(shù)、運動矢量等,采用不同的VLC碼表。H.264中的UVLC碼表提供了一個簡單的方法,不管符號表述什么類型的數(shù)據(jù),都使用統(tǒng)一變字長編碼表。其優(yōu)點是簡單;缺點是單一的碼表是從概率統(tǒng)計分布模型得出的,沒有考慮編碼符號間的相關(guān)性,在中高碼率時效果不是很好。 因此,H.264中還提供了可選的CABAC方法。算術(shù)編碼使編碼和解碼兩邊都能使用所有句法元素(變換系數(shù)、運動矢量)的概率模型。為了提高算術(shù)編碼的效率,通過內(nèi)容建模的過程,使基本概率模型能適應(yīng)隨視頻幀而改變的統(tǒng)計特性。內(nèi)容建模提供了編碼符號的條件概率估計,利用合適的內(nèi)容模型,存在于符號間的相關(guān)性可以通過選擇目前要編碼符號鄰近的已編碼符號的相應(yīng)概率模型來去除,不同的句法元素通常保持不同的模型。 四、H.264在視頻會議中的應(yīng)用 目前,大多數(shù)的視頻會議系統(tǒng)均采用H.261或H.263視頻編碼標(biāo)準,而H.264的出現(xiàn),使得在同等速率下,H.264能夠比H.263減小50%的碼率。也就是說,用戶即使是只利用 384kbit/s的帶寬,就可以享受H.263下高達 768kbit/s的高質(zhì)量視頻服務(wù)。H.264 不但有助于節(jié)省龐大開支,還可以提高資源的使用效率,同時令達到商業(yè)質(zhì)量的視頻會議服務(wù)擁有更多的潛在客戶。 目前,已經(jīng)有少數(shù)幾家廠商的視頻會議產(chǎn)品支持H.264協(xié)議,廠商們致力于普及H.264這個全新的業(yè)界標(biāo)準。隨著其它視頻會議方案廠商陸續(xù)效仿他們的做法,我們必將能全面體驗H.264視頻服務(wù)的優(yōu)勢。
抱歉,此頁面的內(nèi)容受版權(quán)保護,復(fù)制需扣除次數(shù),次數(shù)不足時需付費購買。
如需下載請點擊:點擊此處下載
掃碼付費即可復(fù)制
vista | 大唐高鴻 | 亨通集團 | 中興U85 | SDC | 網(wǎng)段 | ocns | BSSMAP | DPA | 上行鏈路 | 移動IP | 傳真 |
移動通信網(wǎng) | 通信人才網(wǎng) | 更新日志 | 團隊博客 | 免責(zé)聲明 | 關(guān)于詞典 | 幫助