一、視頻編碼MPEG4、H263和H264
1. MPEG4與MPEG1、MPEG2的比較
MPEG 系列標(biāo)準(zhǔn)的基本參數(shù) | ||||
標(biāo)準(zhǔn) |
幅面 |
幀率 |
帶寬 |
應(yīng)用領(lǐng)域 |
MPEG-1 |
352x24 或 320x240 |
24-30 fps |
1.5 Mbps |
Video CD, CD-ROM |
MPEG-2 |
720x24 或 640x480 |
24-30 fps |
4-8 Mbps |
DTV,HDTV,DVD-Video |
MPEG-4 |
34x48 ~ 4096x4096 |
1-30+fps |
10Kbps~10Mbps |
互聯(lián)網(wǎng)及無(wú)線傳輸,交互式電視 |
從上表可以看出,MPEG1和MPEG2主要應(yīng)用于固定媒體,比如 VCD 和 DVD ,而對(duì)于網(wǎng)絡(luò)傳輸,MPEG4具有無(wú)可比擬的優(yōu)勢(shì)。
2. H.263、H.264系列標(biāo)準(zhǔn)介紹
H.263是國(guó)際電聯(lián)ITU-T的一個(gè)標(biāo)準(zhǔn)草案,是為低碼流通信而設(shè)計(jì)的。但實(shí)際上這個(gè)標(biāo)準(zhǔn)可用在很寬的碼流范圍,而非只用于低碼流應(yīng)用,它在許多應(yīng)用中可以認(rèn)為被用于取代H.261。H.263的編碼算法與H.261一樣,但做了一些改善和改變,以提高性能和糾錯(cuò)能力。H.263標(biāo)準(zhǔn)在低碼率下能夠提供比H.261更好的圖像效果,兩者的區(qū)別有:(1)H.263的運(yùn)動(dòng)補(bǔ)償使用半象素精度,而H.261則用全象素精度和循環(huán)濾波;(2)數(shù)據(jù)流層次結(jié)構(gòu)的某些部分在H.263中是可選的,使得編解碼可以配置成更低的數(shù)據(jù)率或更好的糾錯(cuò)能力;(3)H.263 包含四個(gè)可協(xié)商的選項(xiàng)以改善性能;(4)H.263采用無(wú)限制的運(yùn)動(dòng)向量以及基于語(yǔ)法的算術(shù)編碼;(5)采用事先預(yù)測(cè)和與MPEG中的P-B幀一樣的幀預(yù)測(cè)方法;(6)H.263支持5種分辨率,即除了支持H.261中所支持的QCIF和CIF外,還支持SQCIF、4CIF和16CIF,SQCIF相當(dāng)于QCIF一半的分辨率,而4CIF和16CIF分別為CIF的4倍和16倍。H.263已經(jīng)基本上取代了H.261。
H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動(dòng)圖像編碼專家組)的聯(lián)合視頻組(JVT:joint video team)開(kāi)發(fā)的一個(gè)新的數(shù)字視頻編碼標(biāo)準(zhǔn),它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。
H.264和以前的標(biāo)準(zhǔn)一樣,也是DPCM加變換編碼的混合編碼模式。但它采用“回歸基本”的簡(jiǎn)潔設(shè)計(jì),不用眾多的選項(xiàng),獲得比H.263++好得多的壓縮性能;加強(qiáng)了對(duì)各種信道的適應(yīng)能力,采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語(yǔ)法,有利于對(duì)誤碼和丟包的處理;應(yīng)用目標(biāo)范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲(chǔ))場(chǎng)合的需求。
在技術(shù)上,H.264標(biāo)準(zhǔn)中有多個(gè)閃光之處,如統(tǒng)一的VLC符號(hào)編碼,高精度、多模式的位移估計(jì),基于4×4塊的整數(shù)變換、分層的編碼語(yǔ)法等。這些措施使得H.264算法具有很的高編碼效率,在相同的重建圖像質(zhì)量下,能夠比H.263節(jié)約50%左右的碼率。H.264的碼流結(jié)構(gòu)網(wǎng)絡(luò)適應(yīng)性強(qiáng),增加了差錯(cuò)恢復(fù)能力,能夠很好地適應(yīng)IP和無(wú)線網(wǎng)絡(luò)的應(yīng)用。
3.為什么使用 H264標(biāo)準(zhǔn)用作視頻壓縮
分層設(shè)計(jì)
視頻編碼層具有高效的視頻內(nèi)容表示功能;
網(wǎng)絡(luò)提取層將網(wǎng)絡(luò)中所需要的數(shù)據(jù)進(jìn)行打包和傳送;
高精度、多模式運(yùn)動(dòng)設(shè)計(jì)
支持1/4或1/8像素精度的運(yùn)動(dòng)矢量;
多模式的靈活和細(xì)致的劃分,大提高了運(yùn)動(dòng)估計(jì)的精確程度;
幀內(nèi)預(yù)測(cè)功能
在空間域進(jìn)行預(yù)測(cè)編碼算法,以便取得更有效的壓縮:
4×4塊的整數(shù)變換
由于用二變換塊的尺寸縮小,運(yùn)動(dòng)物體的劃分更精確,這樣,不但變換計(jì)算量比較小,而且在運(yùn)動(dòng)物體邊緣處的銜接誤疾差也大為減。
為了提高碼率控制的能力,量化步長(zhǎng)的變化的幅度控制在125%左右,而不是以不變的增幅變化。為了強(qiáng)調(diào)彩色的逼真性,對(duì)色度系數(shù)采用了較小量化步長(zhǎng);
統(tǒng)一的VLC
為快速再同步而經(jīng)過(guò)優(yōu)化的,可以有效防止誤碼。
4.視頻壓縮算法的發(fā)展方向
隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,MPEG4的應(yīng)用也越來(lái)越普遍,H264已經(jīng)無(wú)可爭(zhēng)議地成為了視頻產(chǎn)品壓縮算法的發(fā)展方向。
二、音頻編碼G.723.1
1.國(guó)際電信聯(lián)盟G系列典型語(yǔ)音壓縮標(biāo)準(zhǔn)的參數(shù)比較
算法 |
類型 |
碼率(kbit/s) |
算法延時(shí)(ms) |
G.711 |
A-Law / μ -Law |
64 |
0 |
G.722 |
SB-ADPCM |
64/56/48 |
0 |
G.723.1 |
MP-MLQ/ACELP |
6.3/5.3 |
37.5 |
G.726 |
ADPCM |
16/24/32/40 |
0 |
G.727 |
Embedded ADPCM |
16/24/32/40 |
0 |
G.728 |
LD-CELP |
16 |
< 2 |
G.729 |
CS-ACELP |
8 |
15 |
2. G.723.1 壓縮后的語(yǔ)音質(zhì)量
在國(guó)際標(biāo)準(zhǔn)中,統(tǒng)一使用 MOS(Mean Opinion Score)方法評(píng)價(jià)語(yǔ)音壓縮后的質(zhì)量。在MOS方法中,電話語(yǔ)音質(zhì)量的標(biāo)準(zhǔn)定為4分。也就是說(shuō),如果一種算法將語(yǔ)音壓縮后,MOS 值能達(dá)到4分,即說(shuō)明其語(yǔ)音質(zhì)量和電話質(zhì)量等同,用戶無(wú)法分辨出其中的區(qū)別。
對(duì)于DX4000系統(tǒng),G.723.1壓縮后語(yǔ)音質(zhì)量的MOS評(píng)測(cè)值是3.98(Source: DSP Group Inc., http://www.dspg.com ),即非常接近電話質(zhì)量。
3.為什么使用G.723.1標(biāo)準(zhǔn)用作音頻壓縮
壓縮率高:G.723.1算法將語(yǔ)音壓縮到6.3Kbps,在同類壓縮算法中壓縮率是最高的。
語(yǔ)音質(zhì)量好:G.723.1算法壓縮后的語(yǔ)音質(zhì)量MOS值為3.98分,對(duì)于一般沒(méi)有受過(guò)專門(mén)訓(xùn)練的耳朵,已經(jīng)無(wú)法區(qū)分出語(yǔ)音是否經(jīng)過(guò)壓縮。這樣的語(yǔ)音質(zhì)量完全可以滿足網(wǎng)絡(luò)視頻會(huì)議的需求。