視頻編碼標(biāo)準(zhǔn)解釋:H.264標(biāo)準(zhǔn)詳解

來(lái)源:投影時(shí)代 更新日期:2009-02-01 作者:佚名

    JVT(Joint Video Team,視頻聯(lián)合工作組)于 2001 年 12 月在泰國(guó) Pattaya 成立。它由 ITU-T和 ISO 兩個(gè)國(guó)際標(biāo)準(zhǔn)化組織的有關(guān)視頻編碼的專家聯(lián)合組成。JVT 的工作目標(biāo)是制定一個(gè)新的視頻編碼標(biāo)準(zhǔn),以實(shí)現(xiàn)視頻的高壓縮比、高圖像質(zhì)量、良好的網(wǎng)絡(luò)適應(yīng)性等目標(biāo)。目前 JVT 的工作已被 ITU-T 接納,新的視頻壓縮編碼標(biāo)準(zhǔn)稱為 H.264 標(biāo)準(zhǔn),該標(biāo)準(zhǔn)也被 ISO 接納,稱為 AVC(Advanced Video Coding)標(biāo)準(zhǔn),是 MPEG-4 的第 10 部分。

    H.264 標(biāo)準(zhǔn)可分為三檔:

    基本檔次(其簡(jiǎn)單版本,應(yīng)用面廣);

    主要檔次(采用了多項(xiàng)提高圖像質(zhì)量和增加壓縮比的技術(shù)措施,可用于 SDTV、HDTV 和 DVD 等);

    擴(kuò)展檔次(可用于各種網(wǎng)絡(luò)的視頻流傳輸)。

    H.264 不僅比 H.263 和 MPEG-4 節(jié)約了 50%的碼率,而且對(duì)網(wǎng)絡(luò)傳輸具有更好的支持功能。它引入了面向 IP 包的編碼機(jī)制,有利于網(wǎng)絡(luò)中的分組傳輸,支持網(wǎng)絡(luò)中視頻的流媒體傳輸。H.264 具有較強(qiáng)的抗誤碼特性,可適應(yīng)丟包率高、干擾嚴(yán)重的無(wú)線信道中的視頻傳輸。H.264 支持不同網(wǎng)絡(luò)資源下的分級(jí)編碼傳輸,從而獲得平穩(wěn)的圖像質(zhì)量。H.264 能適應(yīng)于不同網(wǎng)絡(luò)中的視頻傳輸,網(wǎng)絡(luò)親和性好。

    一、H.264 視頻壓縮系統(tǒng)

    H.264 標(biāo)準(zhǔn)壓縮系統(tǒng)由視頻編碼層(VCL)和網(wǎng)絡(luò)提取層(Network Abstraction Layer,NAL)兩部分組成。VCL 中包括 VCL 編碼器與 VCL 解碼器,主要功能是視頻數(shù)據(jù)壓縮編碼和解碼,它包括運(yùn)動(dòng)補(bǔ)償、變換編碼、熵編碼等壓縮單元。NAL 則用于為 VCL 提供一個(gè)與網(wǎng)絡(luò)無(wú)關(guān)的統(tǒng)一接口,它負(fù)責(zé)對(duì)視頻數(shù)據(jù)進(jìn)行封裝打包后使其在網(wǎng)絡(luò)中傳送,它采用統(tǒng)一的數(shù)據(jù)格式,包括單個(gè)字節(jié)的包頭信息、多個(gè)字節(jié)的視頻數(shù)據(jù)與組幀、邏輯信道信令、定時(shí)信息、序列結(jié)束信號(hào)等。包頭中包含存儲(chǔ)標(biāo)志和類型標(biāo)志。存儲(chǔ)標(biāo)志用于指示當(dāng)前數(shù)據(jù)不屬于被參考的幀。類型標(biāo)志用于指示圖像數(shù)據(jù)的類型。VCL 可以傳輸按當(dāng)前的網(wǎng)絡(luò)情況調(diào)整的編碼參數(shù)。

    二、H.264 的特點(diǎn)

    H.264 和 H.261、H.263 一樣,也是采用 DCT 變換編碼加 DPCM 的差分編碼,即混合編碼結(jié)構(gòu)。同時(shí),H.264 在混合編碼的框架下引入了新的編碼方式,提高了編碼效率,更貼近實(shí)際應(yīng)用。H.264 沒(méi)有繁瑣的選項(xiàng),而是力求簡(jiǎn)潔的“回歸基本”,它具有比 H.263++更好的壓縮性能,又具有適應(yīng)多種信道的能力。H.264 的應(yīng)用目標(biāo)廣泛,可滿足各種不同速率、不同場(chǎng)合的視頻應(yīng)用,具有較好的抗誤碼和抗丟包的處理能力。H.264 的基本系統(tǒng)無(wú)需使用版權(quán),具有開(kāi)放的性質(zhì),能很好地適應(yīng) IP 和無(wú)線網(wǎng)絡(luò)的使用,這對(duì)目前因特網(wǎng)傳輸多媒體信息、移動(dòng)網(wǎng)中傳輸寬帶信息等都具有重要意義。盡管 H.264 編碼基本結(jié)構(gòu)與 H.261、H.263 是類似的,但它在很多環(huán)節(jié)做了改進(jìn),現(xiàn)列舉如下。

    1.多種更好的運(yùn)動(dòng)估計(jì)

    高精度估計(jì)在 H.263 中采用了半像素估計(jì),在 H.264 中則進(jìn)一步采用 1/4 像素甚至 1/8 像素的運(yùn)動(dòng)估計(jì)。即真正的運(yùn)動(dòng)矢量的位移可能是以 1/4 甚至 1/8 像素為基本單位的。顯然,運(yùn)動(dòng)矢量位移的精度越高,則幀間剩余誤差越小,傳輸碼率越低,即壓縮比越高。

    在 H.264 中采用了 6 階 FIR 濾波器的內(nèi)插獲得 1/2 像素位置的值。當(dāng) 1/2 像素值獲得后, 1/4 像素值可通過(guò)線性內(nèi)插獲得,對(duì)于 4:1:1 的視頻格式,亮度信號(hào)的 1/4     像素精度對(duì)應(yīng)于色度部分的 1/8 像素的運(yùn)動(dòng)矢量,因此需要對(duì)色度信號(hào)進(jìn)行 1/8 像素的內(nèi)插運(yùn)算。理論上,如果將運(yùn)動(dòng)補(bǔ)償?shù)木仍黾右槐叮ɡ鐝恼袼鼐忍岣叩?1/2 像素精度),可有0.5bit/Sample 的編碼增益,但實(shí)際驗(yàn)證發(fā)現(xiàn)在運(yùn)動(dòng)矢量精度超過(guò) 1/8 像素后,系統(tǒng)基本上就沒(méi)有明顯增益了,因此,在 H.264 中,只采用了 1/4 像素精度的運(yùn)動(dòng)矢量模式,而不是采用 1/8 像素的精度。

    多宏塊劃分模式估計(jì)。在 H.264 的預(yù)測(cè)模式中,一個(gè)宏塊(MB)可劃分成 7 種不同模式的尺寸,這種多模式的靈活、細(xì)微的宏塊劃分,更切合圖像中的實(shí)際運(yùn)動(dòng)物體的形狀,于是,在每個(gè)宏塊中可包含有 1、2、4、8 或 16 個(gè)運(yùn)動(dòng)矢量。

    多參數(shù)幀估計(jì)。在 H.264 中,可采用多個(gè)參數(shù)幀的運(yùn)動(dòng)估計(jì),即在編碼器的緩存中存有多個(gè)剛剛編碼好的參數(shù)幀,編碼器從其中選擇一個(gè)給出更好的編碼效果的作為參數(shù)幀,并指出是哪個(gè)幀被用于預(yù)測(cè),這樣就可獲得比只用上一個(gè)剛編碼好的幀作為預(yù)測(cè)幀的更好的編碼效果。

    2.小尺寸 4*4 的整數(shù)變換

    視頻壓縮編碼中以往的常用單位為 8*8 塊。在 H.264 中卻采用小尺寸的 4*4 塊,由于變換塊的尺寸變小了,運(yùn)動(dòng)物體的劃分就更為精確。這種情況下,圖像變換過(guò)程中的計(jì)算量小了,而且在運(yùn)動(dòng)物體邊緣的銜接誤差也大為減少。

    當(dāng)圖像中有較大面積的平滑區(qū)域時(shí),為了不產(chǎn)生因小尺寸變換帶來(lái)的塊間灰度差異,H.264 可對(duì)幀內(nèi)宏塊亮度數(shù)據(jù)的 16 個(gè) 4*4 塊的 DCT 系數(shù)進(jìn)行第二次 4*4 塊的變換,對(duì)色度數(shù)據(jù)的 4 個(gè) 4*4 塊的 DC 系數(shù)(每個(gè)小塊一個(gè),共 4 個(gè) DC 系數(shù))進(jìn)行 2?2 塊的變換。H.263 不僅使圖像變換塊尺寸變小,而且這個(gè)變換是整數(shù)操作,而不是實(shí)數(shù)運(yùn)算,即編碼器和解碼器的變換和反變換的精度相同,沒(méi)有“反變換誤差”。

    3.更精確的幀內(nèi)預(yù)測(cè)

    在 H.264 中,每個(gè) 4?4 塊中的每個(gè)像素都可用 17 個(gè)最接近先前已編碼的像素的不同加權(quán)和來(lái)進(jìn)行幀內(nèi)預(yù)測(cè)。

    4.統(tǒng)一的 VLC

    H.264 中關(guān)于熵編碼有兩種方法。

    統(tǒng)一的 VLC(即 UVLC:Universal VLC)。UVLC 使用一個(gè)相同的碼表進(jìn)行編碼,而解碼器很容易識(shí)別碼字的前綴,UVLC 在發(fā)生比特錯(cuò)誤時(shí)能快速獲得重同步。內(nèi)容自適應(yīng)二進(jìn)制算術(shù)編碼(CABAC:Context Adaptive Binary Arithmetic Coding)。其編碼性能比 UVLC 稍好,但復(fù)雜度較高。

    三、性能優(yōu)勢(shì)

    H.264 與 MPEG-4、H.263++編碼性能對(duì)比采用了以下 6 個(gè)測(cè)試速率:32kbit/s、10F/s 和 QCIF;64kbit/s、15F/s 和 QCIF;128kbit/s、15F/s 和 CIF;256kbit/s、15F/s 和 QCIF;512kbit/s、30F/s和 CIF;1024kbit/s、30F/s 和 CIF。測(cè)試結(jié)果標(biāo)明,H.264 具有比 MPEG 和 H.263++更優(yōu)秀的 PSNR性能。H.264 的 PSNR 比 MPEG-4 平均要高 2dB,比 H.263++平均要高 3dB。

    四、新的快速運(yùn)動(dòng)估值算法

    新的快速運(yùn)動(dòng)估值算法 UMHexagonS(中國(guó)專利)是一種運(yùn)算量相對(duì)于 H.264 中原有的快速全搜索算法可節(jié)約 90%以上的新算法,全名叫“非對(duì)稱十字型多層次六邊形格點(diǎn)搜索算法”(Unsymmetrical-Cross Muti-Hexagon Search)”,這是一種整像素運(yùn)動(dòng)估值算法。由于它在高碼率大運(yùn)動(dòng)圖像序列編碼時(shí),在保持較好率失真性能的條件下,運(yùn)算量十分低,已被 H.264 標(biāo)準(zhǔn)正式采納。ITU 和 ISO 合作發(fā)展的 H.264(MPEG-4 Part 10)有可能被廣播、通信和存儲(chǔ)媒體(CD DVD)接受成為統(tǒng)一的標(biāo)準(zhǔn),最有可能成為寬帶交互新媒體的標(biāo)準(zhǔn)。我國(guó)的信源編碼標(biāo)準(zhǔn)尚未制定,密切關(guān)注H.264 的發(fā)展,制定我國(guó)的信源編碼標(biāo)準(zhǔn)的工作正在加緊進(jìn)行。H264 標(biāo)準(zhǔn)使運(yùn)動(dòng)圖像壓縮技術(shù)上升到了一個(gè)更高的階段,在較低帶寬上提供高質(zhì)量的圖像傳輸是H.264 的應(yīng)用亮點(diǎn)。H.264 的推廣應(yīng)用對(duì)視頻終端、網(wǎng)守、網(wǎng)關(guān)、MCU 等系統(tǒng)的要求較高,將有力地推動(dòng)視頻會(huì)議軟、硬件設(shè)備在各個(gè)方面的不斷完善。

廣告聯(lián)系:010-82755684 | 010-82755685 手機(jī)版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時(shí)代網(wǎng) 版權(quán)所有 關(guān)于投影時(shí)代 | 聯(lián)系我們 | 歡迎來(lái)稿 | 網(wǎng)站地圖
返回首頁(yè) 網(wǎng)友評(píng)論 返回頂部 建議反饋
快速評(píng)論
驗(yàn)證碼: 看不清?點(diǎn)一下
發(fā)表評(píng)論