百科解釋
目錄·視頻編碼定義·視頻編碼原理·視頻編碼框架·視頻編碼技術(shù) 視頻編碼定義 所謂視頻編碼方式就是指通過特定的壓縮技術(shù),將某個視頻格式的文件轉(zhuǎn)換成另一種視頻格式文件的方式。目前視頻流傳輸中最為重要的編解碼標(biāo)準(zhǔn)有國際電聯(lián)的H.261、H.263,運動靜止圖像專家組的M-JPEG和國際標(biāo)準(zhǔn)化組織運動圖像專家組的MPEG系列標(biāo)準(zhǔn),此外在互聯(lián)網(wǎng)上被廣泛應(yīng)用的還有Real-Networks的RealVideo、微軟公司的WMT以及Apple公司的QuickTime等。 MPEG是活動圖像專家組(Moving Picture Exports Group)的縮寫,于1988年成立,是為數(shù)字視/音頻制定壓縮標(biāo)準(zhǔn)的專家組,目前已擁有300多名成員,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG組織最初得到的授權(quán)是制定用于“活動圖像”編碼的各種標(biāo)準(zhǔn),隨后擴(kuò)充為“及其伴隨的音頻”及其組合編碼。后來針對不同的應(yīng)用需求,解除了“用于數(shù)字存儲媒體”的限制,成為現(xiàn)在制定“活動圖像和音頻編碼”標(biāo)準(zhǔn)的組織。MPEG組織制定的各個標(biāo)準(zhǔn)都有不同的目標(biāo)和應(yīng)用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21標(biāo)準(zhǔn)。視頻編碼原理 視頻圖像數(shù)據(jù)有極強(qiáng)的相關(guān)性,也就是說有大量的冗余信息。其中冗余信息可分為空域冗余信息和時域冗余信息。壓縮技術(shù)就是將數(shù)據(jù)中的冗余信息去掉(去除數(shù)據(jù)之間的相關(guān)性),壓縮技術(shù)包含幀內(nèi)圖像數(shù)據(jù)壓縮技術(shù)、幀間圖像數(shù)據(jù)壓縮技術(shù)和熵編碼壓縮技術(shù)。 去時域冗余信息 使用幀間編碼技術(shù)可去除時域冗余信息,它包括以下三部分: 。 運動補(bǔ)償 運動補(bǔ)償是通過先前的局部圖像來預(yù)測、補(bǔ)償當(dāng)前的局部圖像,它是減少幀序列冗余信息的有效方法。 - 運動表示 不同區(qū)域的圖像需要使用不同的運動矢量來描述運動信息。運動矢量通過熵編碼進(jìn)行壓縮。 。 運動估計 運動估計是從視頻序列中抽取運動信息的一整套技術(shù)。 注:通用的壓縮標(biāo)準(zhǔn)都使用基于塊的運動估計和運動補(bǔ)償。 去空域冗余信息 主要使用幀間編碼技術(shù)和熵編碼技術(shù): 。 變換編碼 幀內(nèi)圖像和預(yù)測差分信號都有很高的空域冗余信息。變換編碼將空域信號變換到另一正交矢量空間,使其相關(guān)性下降,數(shù)據(jù)冗余度減小。 - 量化編碼 經(jīng)過變換編碼后,產(chǎn)生一批變換系數(shù),對這些系數(shù)進(jìn)行量化,使編碼器的輸出達(dá)到一定的位率。這一過程導(dǎo)致精度的降低。 - 熵編碼 熵編碼是無損編碼。它對變換、量化后得到的系數(shù)和運動信息,進(jìn)行進(jìn)一步的壓縮。視頻編碼框架 視頻編碼的基本框架(圖) 國際音視頻壓縮標(biāo)準(zhǔn)發(fā)展歷程: H.261 H.261標(biāo)準(zhǔn)是為ISDN設(shè)計,主要針對實時編碼和解碼設(shè)計,壓縮和解壓縮的信號延時不超過150ms,碼率px64kbps(p=1~30)。 H.261標(biāo)準(zhǔn)主要采用運動補(bǔ)償?shù)膸g預(yù)測、DCT變換、自適應(yīng)量化、熵編碼等壓縮技術(shù)。 只有I幀和P幀,沒有B幀,運動估計精度只精確到像素級。支持兩種圖像掃描格式:QCIF和CIF。 H.263 H.263標(biāo)準(zhǔn)是甚低碼率的圖像編碼國際標(biāo)準(zhǔn),它一方面以H.261為基礎(chǔ),以混合編碼為核心,其基本原理框圖和H.261十分相似,原始數(shù)據(jù)和碼流組織也相似;另一方面,H.263也吸收了MPEG等其它一些國際標(biāo)準(zhǔn)中有效、合理的部分,如:半像素精度的運動估計、PB幀預(yù)測等,使它性能優(yōu)于H.261。 H.263使用的位率可小于64Kb/s,且傳輸比特率可不固定(變碼率)。H.263支持多種分辨率: SQCIF(128x96)、 QCIF、CIF、4CIF、16CIF。 與H.261和H.263相關(guān)的國際標(biāo)準(zhǔn); 與H.261有關(guān)的國際標(biāo)準(zhǔn); H.320:窄帶可視電話系統(tǒng)和終端設(shè)備; H.221:視聽電信業(yè)務(wù)中64~1 920Kb/s信道的幀結(jié)構(gòu); H.230:視聽系統(tǒng)的幀同步控制和指示信號; H.242:使用直到2Mb/s數(shù)字信道的視聽終端的系統(tǒng)。 與H.263有關(guān)的國際標(biāo)準(zhǔn); H.324:甚低碼率多媒體通信終端設(shè)備; H.223:甚低碼率多媒體通信復(fù)合協(xié)議; H.245:多媒體通信控制協(xié)議; G.723.1.1:傳輸速率為5.3Kb/s和6.3Kb/s的語音編碼器。 JPEG 國際標(biāo)準(zhǔn)化組織于1986年成立了JPEG(Joint Photographic Expert Group)聯(lián)合圖片專家小組,主要致力于制定連續(xù)色調(diào)、多級灰度、靜態(tài)圖像的數(shù)字圖像壓縮編碼標(biāo)準(zhǔn)。常用的基于離散余弦變換(DCT)的編碼方法,是JPEG算法的核心內(nèi)容。 MPEG-1/2 MPEG-1標(biāo)準(zhǔn)用于數(shù)字存儲體上活動圖像及其伴音的編碼,其數(shù)碼率為1.5Mb/s。 MPEG-1的視頻原理框圖和H.261的相似。 MPEG-1視頻壓縮技術(shù)的特點:1. 隨機(jī)存;2. 快速正向/逆向搜索;3 .逆向重播;4. 視聽同步;5. 容錯性;6. 編/解碼延遲。MPEG-1視頻壓縮策略:為了提高壓縮比,幀內(nèi)/幀間圖像數(shù)據(jù)壓縮技術(shù)必須同時使用。幀內(nèi)壓縮算法與JPEG壓縮算法大致相同,采用基于DCT的變換編碼技術(shù),用以減少空域冗余信息。幀間壓縮算法,采用預(yù)測法和插補(bǔ)法。預(yù)測誤差可在通過DCT變換編碼處理,進(jìn)一步壓縮。幀間編碼技術(shù)可減少時間軸方向的冗余信息。 MPEG-2被稱為“21世紀(jì)的電視標(biāo)準(zhǔn)”,它在MPEG-1的基礎(chǔ)上作了許多重要的擴(kuò)展和改進(jìn),但基本算法和MPEG-1相同。 MPEG-4 MPEG-4標(biāo)準(zhǔn)并非是MPEG-2的替代品,它著眼于不同的應(yīng)用領(lǐng)域。MPEG-4的制定初衷主要針對視頻會議、可視電話超低比特率壓縮(小于64Kb/s)的需求。在制定過程中,MPEG組織深深感受到人們對媒體信息,特別是對視頻信息的需求由播放型轉(zhuǎn)向基于內(nèi)容的訪問、檢索和操作。 MPEG-4與前面提到的JPEG、MPEG-1/2有很大的不同,它為多媒體數(shù)據(jù)壓縮編碼提供了更為廣闊的平臺,它定義的是一種格式、一種框架,而不是具體算法,它希望建立一種更自由的通信與開發(fā)環(huán)境。于是MPEG-4新的目標(biāo)就是定義為:支持多種多媒體的應(yīng)用,特別是多媒體信息基于內(nèi)容的檢索和訪問,可根據(jù)不同的應(yīng)用需求,現(xiàn)場配置解碼器。編碼系統(tǒng)也是開放的,可隨時加入新的有效的算法模塊。應(yīng)用范圍包括實時視聽通信、多媒體通信、遠(yuǎn)地監(jiān)測/監(jiān)視、VOD、家庭購物/娛樂等。 JVT:新一代的視頻壓縮標(biāo)準(zhǔn) JVT是由ISO/IEC MPEG和ITU-T VCEG成立的聯(lián)合視頻工作組(Joint Video Team),致力于新一代數(shù)字視頻壓縮標(biāo)準(zhǔn)的制定。 JVT標(biāo)準(zhǔn)在ISO/IEC中的正式名稱為:MPEG-4 AVC(part10)標(biāo)準(zhǔn);在ITU-T中的名稱:H.264(早期被稱為H.26L) H264/AVC H264集中了以往標(biāo)準(zhǔn)的優(yōu)點,并吸收了以往標(biāo)準(zhǔn)制定中積累的經(jīng)驗, 采用簡潔設(shè)計,使它比MPEG4更容易推廣。H.264創(chuàng)造性了多參考幀、多塊類型、整數(shù)變換、幀內(nèi)預(yù)測等新的壓縮技術(shù),使用了更精細(xì)的分象素運動矢量(1/4、1/8)和新一代的環(huán)路濾波器,使得壓縮性能大大提高,系統(tǒng)更加完善。 H.264主要有以下幾大優(yōu)點: 。 高效壓縮:與H.263+和MPEG4 SP相比,減小50%比特率; - 延時約束方面有很好的柔韌性; 。 容錯能力; - 編/解碼的復(fù)雜性可伸縮性; - 解碼全部細(xì)節(jié):沒有不匹配; - 高質(zhì)量應(yīng)用; 。 網(wǎng)絡(luò)友善。視頻編碼技術(shù) 目前監(jiān)控中主要采用MJPEG、MPEG1/2、MPEG4(SP/ASP)、H.264/AVC等幾種視頻編碼技術(shù)。對于最終用戶來言他最為關(guān)心的主要有:清晰度、存儲量(帶寬)、穩(wěn)定性還有價格。采用不同的壓縮技術(shù),將很大程度影響以上幾大要素。 MJPEG MJPEG(Motion JPEG)壓縮技術(shù),主要是基于靜態(tài)視頻壓縮發(fā)展起來的技術(shù),它的主要特點是基本不考慮視頻流中不同幀之間的變化,只單獨對某一幀進(jìn)行壓縮。 MJPEG壓縮技術(shù)可以獲取清晰度很高的視頻圖像,可以動態(tài)調(diào)整幀率、分辨率。但由于沒有考慮到幀間變化,造成大量冗余信息被重復(fù)存儲,因此單幀視頻的占用空間較大,目前流行的MJPEG技術(shù)最好的也只能做到3K字節(jié)/幀,通常要8~20K! MPEG-1/2 MPEG-1標(biāo)準(zhǔn)主要針對SIF標(biāo)準(zhǔn)分辨率(NTSC制為352X240;PAL制為352X288)的圖像進(jìn)行壓縮. 壓縮位率主要目標(biāo)為1.5Mb/s.較MJPEG技術(shù),MPEG1在實時壓縮、每幀數(shù)據(jù)量、處理速度上有顯著的提高。但MPEG1也有較多不利地方:存儲容量還是過大、清晰度不夠高和網(wǎng)絡(luò)傳輸困難。 MPEG-2 在MPEG-1基礎(chǔ)上進(jìn)行了擴(kuò)充和提升,和MPEG-1向下兼容,主要針對存儲媒體、數(shù)字電視、高清晰等應(yīng)用領(lǐng)域,分辨率為:低(352x288),中(720x480),次高(1440x1080),高(1920x1080)。MPEG-2視頻相對MPEG-1提升了分辨率,滿足了用戶高清晰的要求,但由于壓縮性能沒有多少提高,使得存儲容量還是太大,也不適和網(wǎng)絡(luò)傳輸。 MPEG-4 MPEG-4視頻壓縮算法相對于MPEG-1/2在低比特率壓縮上有著顯著提高,在CIF(352*288)或者更高清晰度(768*576)情況下的視頻壓縮,無論從清晰度還是從存儲量上都比MPEG1具有更大的優(yōu)勢,也更適合網(wǎng)絡(luò)傳輸。另外MPEG-4可以方便地動態(tài)調(diào)整幀率、比特率,以降低存儲量。 MPEG-4由于系統(tǒng)設(shè)計過于復(fù)雜,使得MPEG-4難以完全實現(xiàn)并且兼容,很難在視頻會議、可視電話等領(lǐng)域?qū)崿F(xiàn),這一點有點偏離原來地初衷。另外對于中國企業(yè)來說還要面臨高昂的專利費問題,目前規(guī)定: 。 每臺解碼設(shè)備需要交給MPEG-LA 0.25美元。 - 編碼/解碼設(shè)備還需要按時間交費(4美分/天=1.2美元/月 =14.4美元/年)。 H.264/AVC H.264集中了以往標(biāo)準(zhǔn)的優(yōu)點,在許多領(lǐng)域都得到突破性進(jìn)展,使得它獲得比以往標(biāo)準(zhǔn)好得多整體性能: 。 和H.263+和MPEG-4 SP相比最多可節(jié)省50%的碼率,使存儲容量大大降低; 。 H.264在不同分辨率、不同碼率下都能提供較高的視頻質(zhì)量; - 采用“網(wǎng)絡(luò)友善”的結(jié)構(gòu)和語法,使其更有利于網(wǎng)絡(luò)傳輸。 H.264采用簡潔設(shè)計,使它比MPEG4更容易推廣,更容易在視頻會議、視頻電話中實現(xiàn),更容易實現(xiàn)互連互通,可以簡便地和G.729等低比特率語音壓縮組成一個完整的系統(tǒng)。 MPEG LA吸收MPEG-4的高昂專利費而使它難以推廣的教訓(xùn),MPEG LA制定了以下低廉的H.264收費標(biāo)準(zhǔn):H.264廣播時基本不收費;產(chǎn)品中嵌入H.264編/解碼器時,年產(chǎn)量10萬臺以下不收取費,超過10萬臺每臺收取0.2美元,超過500萬臺每臺收取0.1美元。低廉的專利費使得中國H.264監(jiān)控產(chǎn)品更容易走向世界。 監(jiān)控中視頻編碼分辨率的選擇 目前監(jiān)控行業(yè)中主要使用以下分辨率:SQCIF、QCIF、CIF、4CIF。 SQCIF和QCIF的優(yōu)點是存儲量低,可以在窄帶中使用,使用這種分辨率的產(chǎn)品價格低廉;缺點是圖像質(zhì)量往往很差、不被用戶所接受。 CIF是目前監(jiān)控行業(yè)的主流分辨率,它的優(yōu)點是存儲量較低,能在普通寬帶網(wǎng)絡(luò)中傳輸,價格也相對低廉,它的圖像質(zhì)量較好,被大部分用戶所接受。缺點是圖像質(zhì)量不能滿足高清晰的要求。 4CIF是標(biāo)清分辨率,它的優(yōu)點是圖像清晰。缺點是存儲量高,網(wǎng)絡(luò)傳輸帶寬要求很高,價格也較高。 分辨率新的選擇-528x384。 2CIF(704x288)已被部分產(chǎn)品采用,用來解決CIF清晰度不夠高和4CIF存儲量高、價格高昂的缺點。但由于704x288只是水平分辨率的提升,圖像質(zhì)量提高不是特別明顯。 經(jīng)過測試,我們發(fā)現(xiàn)另外一種2CIF分辨率528x384,比704x288能更好解決CIF、4CIF的問題。特別是在512Kbps-1Mbps碼率之間,能獲得穩(wěn)定的高質(zhì)量圖像,滿足用戶較高圖像質(zhì)量的要求。目前這一分辨率已被許多網(wǎng)絡(luò)多媒體廣播所采用,被廣大用戶所接受。比如杭州網(wǎng)通網(wǎng)上影院是采用512x384分辨率,在768k下能穩(wěn)定地獲得近似DVD的圖像質(zhì)量。 監(jiān)控中實現(xiàn)視頻編碼的最佳方式 目前視頻編碼正處于一個技術(shù)日新月異的時期,視頻編碼的壓縮性能在不斷得到提升。 在監(jiān)控中主要使用ASCI和DSP兩種方案。由于ASIC芯片的設(shè)計、生產(chǎn)周期過長,使它已跟不上視頻編碼的發(fā)展速度。而DSP芯片,由于它的通用設(shè)計,使它能實現(xiàn)各種視頻編碼算法,并且可以及時更新視頻編碼器,緊跟視頻編碼的發(fā)展速度。另外使用DSP芯片可以比ASIC更靈活的配置編碼器,使編碼器達(dá)到最佳性能。 海康威視產(chǎn)品目前達(dá)到的技術(shù)水準(zhǔn)。 ?低暜a(chǎn)品采用最先進(jìn)的H.264視頻壓縮算法和高性能的DSP處理器。 強(qiáng)大的H.264視頻壓縮引擎使產(chǎn)品獲得極高的壓縮比、高質(zhì)量的圖像質(zhì)量和良好的網(wǎng)絡(luò)傳輸性能。高性能的DSP處理器能靈活的配置視頻編/解碼器:動態(tài)設(shè)置分辨率、幀率、碼率、圖像質(zhì)量等;可以雙碼流輸出,達(dá)到本地存儲和網(wǎng)絡(luò)傳輸分別處理的功能。 使用TM130X DSP的產(chǎn)品,單個芯片能實時壓縮一路以下分辨率的視頻:SQCIF、QCIF、CIF、2CIF(PAL:704x288或528x384)。 使用DM642 DSP的產(chǎn)品,單個芯片能實時壓縮4路以下分辨率的視頻:SQCIF、QCIF、CIF、2CIF(PAL:704x288或528x384)。單個芯片能實時壓縮2路4CIF視頻。
移動通信網(wǎng) | 通信人才網(wǎng) | 更新日志 | 團(tuán)隊博客 | 免責(zé)聲明 | 關(guān)于詞典 | 幫助