視頻編碼標(biāo)準(zhǔn)解釋?zhuān)篐.264標(biāo)準(zhǔn)詳解

來(lái)源：投影時(shí)代　更新日期：2009-02-01 作者：佚名

年度評(píng)選盛典獲獎(jiǎng)揭曉 Infocomm China 深入報(bào)道年度商顯市場(chǎng)最大的看點(diǎn)何在

JVT（Joint Video Team，視頻聯(lián)合工作組）于 2001 年 12 月在泰國(guó) Pattaya 成立。它由 ITU-T和 ISO 兩個(gè)國(guó)際標(biāo)準(zhǔn)化組織的有關(guān)視頻編碼的專(zhuān)家聯(lián)合組成。JVT 的工作目標(biāo)是制定一個(gè)新的視頻編碼標(biāo)準(zhǔn)，以實(shí)現(xiàn)視頻的高壓縮比、高圖像質(zhì)量、良好的網(wǎng)絡(luò)適應(yīng)性等目標(biāo)。目前 JVT 的工作已被 ITU-T 接納，新的視頻壓縮編碼標(biāo)準(zhǔn)稱(chēng)為 H.264 標(biāo)準(zhǔn)，該標(biāo)準(zhǔn)也被 ISO 接納，稱(chēng)為 AVC（Advanced Video Coding）標(biāo)準(zhǔn)，是 MPEG-4 的第 10 部分。

H.264 標(biāo)準(zhǔn)可分為三檔：

基本檔次（其簡(jiǎn)單版本，應(yīng)用面廣）；

主要檔次（采用了多項(xiàng)提高圖像質(zhì)量和增加壓縮比的技術(shù)措施，可用于 SDTV、HDTV 和 DVD 等）；

擴(kuò)展檔次（可用于各種網(wǎng)絡(luò)的視頻流傳輸）。

H.264 不僅比 H.263 和 MPEG-4 節(jié)約了 50％的碼率，而且對(duì)網(wǎng)絡(luò)傳輸具有更好的支持功能。它引入了面向 IP 包的編碼機(jī)制，有利于網(wǎng)絡(luò)中的分組傳輸，支持網(wǎng)絡(luò)中視頻的流媒體傳輸。H.264 具有較強(qiáng)的抗誤碼特性，可適應(yīng)丟包率高、干擾嚴(yán)重的無(wú)線信道中的視頻傳輸。H.264 支持不同網(wǎng)絡(luò)資源下的分級(jí)編碼傳輸，從而獲得平穩(wěn)的圖像質(zhì)量。H.264 能適應(yīng)于不同網(wǎng)絡(luò)中的視頻傳輸，網(wǎng)絡(luò)親和性好。

一、H.264 視頻壓縮系統(tǒng)

H.264 標(biāo)準(zhǔn)壓縮系統(tǒng)由視頻編碼層（VCL）和網(wǎng)絡(luò)提取層（Network Abstraction Layer，NAL）兩部分組成。VCL 中包括 VCL 編碼器與 VCL 解碼器，主要功能是視頻數(shù)據(jù)壓縮編碼和解碼，它包括運(yùn)動(dòng)補(bǔ)償、變換編碼、熵編碼等壓縮單元。NAL 則用于為 VCL 提供一個(gè)與網(wǎng)絡(luò)無(wú)關(guān)的統(tǒng)一接口，它負(fù)責(zé)對(duì)視頻數(shù)據(jù)進(jìn)行封裝打包后使其在網(wǎng)絡(luò)中傳送，它采用統(tǒng)一的數(shù)據(jù)格式，包括單個(gè)字節(jié)的包頭信息、多個(gè)字節(jié)的視頻數(shù)據(jù)與組幀、邏輯信道信令、定時(shí)信息、序列結(jié)束信號(hào)等。包頭中包含存儲(chǔ)標(biāo)志和類(lèi)型標(biāo)志。存儲(chǔ)標(biāo)志用于指示當(dāng)前數(shù)據(jù)不屬于被參考的幀。類(lèi)型標(biāo)志用于指示圖像數(shù)據(jù)的類(lèi)型。VCL 可以傳輸按當(dāng)前的網(wǎng)絡(luò)情況調(diào)整的編碼參數(shù)。

二、H.264 的特點(diǎn)

H.264 和 H.261、H.263 一樣，也是采用 DCT 變換編碼加 DPCM 的差分編碼，即混合編碼結(jié)構(gòu)。同時(shí)，H.264 在混合編碼的框架下引入了新的編碼方式，提高了編碼效率，更貼近實(shí)際應(yīng)用。H.264 沒(méi)有繁瑣的選項(xiàng)，而是力求簡(jiǎn)潔的“回歸基本”，它具有比 H.263++更好的壓縮性能，又具有適應(yīng)多種信道的能力。H.264 的應(yīng)用目標(biāo)廣泛，可滿(mǎn)足各種不同速率、不同場(chǎng)合的視頻應(yīng)用，具有較好的抗誤碼和抗丟包的處理能力。H.264 的基本系統(tǒng)無(wú)需使用版權(quán)，具有開(kāi)放的性質(zhì)，能很好地適應(yīng) IP 和無(wú)線網(wǎng)絡(luò)的使用，這對(duì)目前因特網(wǎng)傳輸多媒體信息、移動(dòng)網(wǎng)中傳輸寬帶信息等都具有重要意義。盡管 H.264 編碼基本結(jié)構(gòu)與 H.261、H.263 是類(lèi)似的，但它在很多環(huán)節(jié)做了改進(jìn)，現(xiàn)列舉如下。

1．多種更好的運(yùn)動(dòng)估計(jì)

高精度估計(jì)在 H.263 中采用了半像素估計(jì)，在 H.264 中則進(jìn)一步采用 1/4 像素甚至 1/8 像素的運(yùn)動(dòng)估計(jì)。即真正的運(yùn)動(dòng)矢量的位移可能是以 1/4 甚至 1/8 像素為基本單位的。顯然，運(yùn)動(dòng)矢量位移的精度越高，則幀間剩余誤差越小，傳輸碼率越低，即壓縮比越高。

在 H.264 中采用了 6 階 FIR 濾波器的內(nèi)插獲得 1/2 像素位置的值。當(dāng) 1/2 像素值獲得后， 1/4 像素值可通過(guò)線性?xún)?nèi)插獲得，對(duì)于 4:1:1 的視頻格式，亮度信號(hào)的 1/4 像素精度對(duì)應(yīng)于色度部分的 1/8 像素的運(yùn)動(dòng)矢量，因此需要對(duì)色度信號(hào)進(jìn)行 1/8 像素的內(nèi)插運(yùn)算。理論上，如果將運(yùn)動(dòng)補(bǔ)償?shù)木仍黾右槐叮ɡ鐝恼袼鼐忍岣叩?1/2 像素精度），可有0.5bit/Sample 的編碼增益，但實(shí)際驗(yàn)證發(fā)現(xiàn)在運(yùn)動(dòng)矢量精度超過(guò) 1/8 像素后，系統(tǒng)基本上就沒(méi)有明顯增益了，因此，在 H.264 中，只采用了 1/4 像素精度的運(yùn)動(dòng)矢量模式，而不是采用 1/8 像素的精度。

多宏塊劃分模式估計(jì)。在 H.264 的預(yù)測(cè)模式中，一個(gè)宏塊（MB）可劃分成 7 種不同模式的尺寸，這種多模式的靈活、細(xì)微的宏塊劃分，更切合圖像中的實(shí)際運(yùn)動(dòng)物體的形狀，于是，在每個(gè)宏塊中可包含有 1、2、4、8 或 16 個(gè)運(yùn)動(dòng)矢量。

多參數(shù)幀估計(jì)。在 H.264 中，可采用多個(gè)參數(shù)幀的運(yùn)動(dòng)估計(jì)，即在編碼器的緩存中存有多個(gè)剛剛編碼好的參數(shù)幀，編碼器從其中選擇一個(gè)給出更好的編碼效果的作為參數(shù)幀，并指出是哪個(gè)幀被用于預(yù)測(cè)，這樣就可獲得比只用上一個(gè)剛編碼好的幀作為預(yù)測(cè)幀的更好的編碼效果。

2．小尺寸 4*4 的整數(shù)變換

視頻壓縮編碼中以往的常用單位為 8*8 塊。在 H.264 中卻采用小尺寸的 4*4 塊，由于變換塊的尺寸變小了，運(yùn)動(dòng)物體的劃分就更為精確。這種情況下，圖像變換過(guò)程中的計(jì)算量小了，而且在運(yùn)動(dòng)物體邊緣的銜接誤差也大為減少。

當(dāng)圖像中有較大面積的平滑區(qū)域時(shí)，為了不產(chǎn)生因小尺寸變換帶來(lái)的塊間灰度差異，H.264 可對(duì)幀內(nèi)宏塊亮度數(shù)據(jù)的 16 個(gè) 4*4 塊的 DCT 系數(shù)進(jìn)行第二次 4*4 塊的變換，對(duì)色度數(shù)據(jù)的 4 個(gè) 4*4 塊的 DC 系數(shù)（每個(gè)小塊一個(gè)，共 4 個(gè) DC 系數(shù)）進(jìn)行 2?2 塊的變換。H.263 不僅使圖像變換塊尺寸變小，而且這個(gè)變換是整數(shù)操作，而不是實(shí)數(shù)運(yùn)算，即編碼器和解碼器的變換和反變換的精度相同，沒(méi)有“反變換誤差”。

3．更精確的幀內(nèi)預(yù)測(cè)

在 H.264 中，每個(gè) 4?4 塊中的每個(gè)像素都可用 17 個(gè)最接近先前已編碼的像素的不同加權(quán)和來(lái)進(jìn)行幀內(nèi)預(yù)測(cè)。

4．統(tǒng)一的 VLC

H.264 中關(guān)于熵編碼有兩種方法。

統(tǒng)一的 VLC（即 UVLC：Universal VLC）。UVLC 使用一個(gè)相同的碼表進(jìn)行編碼，而解碼器很容易識(shí)別碼字的前綴，UVLC 在發(fā)生比特錯(cuò)誤時(shí)能快速獲得重同步。內(nèi)容自適應(yīng)二進(jìn)制算術(shù)編碼（CABAC：Context Adaptive Binary Arithmetic Coding）。其編碼性能比 UVLC 稍好，但復(fù)雜度較高。

三、性能優(yōu)勢(shì)

H.264 與 MPEG-4、H.263++編碼性能對(duì)比采用了以下 6 個(gè)測(cè)試速率：32kbit/s、10F/s 和 QCIF；64kbit/s、15F/s 和 QCIF；128kbit/s、15F/s 和 CIF；256kbit/s、15F/s 和 QCIF；512kbit/s、30F/s和 CIF；1024kbit/s、30F/s 和 CIF。測(cè)試結(jié)果標(biāo)明，H.264 具有比 MPEG 和 H.263++更優(yōu)秀的 PSNR性能。H.264 的 PSNR 比 MPEG-4 平均要高 2dB，比 H.263++平均要高 3dB。

四、新的快速運(yùn)動(dòng)估值算法

新的快速運(yùn)動(dòng)估值算法 UMHexagonS（中國(guó)專(zhuān)利）是一種運(yùn)算量相對(duì)于 H.264 中原有的快速全搜索算法可節(jié)約 90％以上的新算法，全名叫“非對(duì)稱(chēng)十字型多層次六邊形格點(diǎn)搜索算法”（Unsymmetrical-Cross Muti-Hexagon Search）”，這是一種整像素運(yùn)動(dòng)估值算法。由于它在高碼率大運(yùn)動(dòng)圖像序列編碼時(shí)，在保持較好率失真性能的條件下，運(yùn)算量十分低，已被 H.264 標(biāo)準(zhǔn)正式采納。ITU 和 ISO 合作發(fā)展的 H.264（MPEG-4 Part 10）有可能被廣播、通信和存儲(chǔ)媒體（CD DVD）接受成為統(tǒng)一的標(biāo)準(zhǔn)，最有可能成為寬帶交互新媒體的標(biāo)準(zhǔn)。我國(guó)的信源編碼標(biāo)準(zhǔn)尚未制定，密切關(guān)注H.264 的發(fā)展，制定我國(guó)的信源編碼標(biāo)準(zhǔn)的工作正在加緊進(jìn)行。H264 標(biāo)準(zhǔn)使運(yùn)動(dòng)圖像壓縮技術(shù)上升到了一個(gè)更高的階段，在較低帶寬上提供高質(zhì)量的圖像傳輸是H.264 的應(yīng)用亮點(diǎn)。H.264 的推廣應(yīng)用對(duì)視頻終端、網(wǎng)守、網(wǎng)關(guān)、MCU 等系統(tǒng)的要求較高，將有力地推動(dòng)視頻會(huì)議軟、硬件設(shè)備在各個(gè)方面的不斷完善。

返回視頻監(jiān)控頻道首頁(yè)