国产在线中文字幕亚洲,一区视频国产精品观看,欧美日韩国产高清片,久久久久久AV无码免费网站,亚洲无码一二三四五区,日韩无码www.,sese444

您好,歡迎來到維庫電子市場網(wǎng) 登錄 | 免費注冊

H.264
閱讀�29621時間�2011-01-17 14:25:42

  H.264是一種高性能的視頻編解碼技�(shù)。目前國際上制定視頻編解碼技�(shù)的組織有兩�,一個是“國際電�(lián)(ITU-T)�,它制定的標(biāo)�(zhǔn)有H.261、H.263、H.263+等,另一個是“國際標(biāo)�(zhǔn)化組織(ISO)”它制定的標(biāo)�(zhǔn)�MPEG-1�MPEG-2、MPEG-4�。而H.264則是由兩個組織聯(lián)合組建的�(lián)合視頻組(JVT)共同制定的��(shù)字視�編碼�(biāo)�(zhǔn),所以它既是ITU-T的H.264,又是ISO/IEC的MPEG-4視頻編碼(Advanced Video Coding,AVC�,而且它將成為MPEG-4�(biāo)�(zhǔn)的第10部分。因�,不論是MPEG-4 AVC、MPEG-4 Part 10,還是ISO/IEC 14496-10,都是指H.264�

特點

  1、分層設(shè)�

  H.264的算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負�(zé)高效的視頻內(nèi)容表�,網(wǎng)�(luò)提取層(NAL:Network Abstraction Layer)負�(zé)以網(wǎng)�(luò)所要求的恰�(dāng)?shù)姆绞綄?shù)�(jù)進行打包和傳�。在VCL和NAL之間定義了一個基于分組方式的接口,打包和相應(yīng)的信令屬于NAL的一部分。這樣,高編碼效率和網(wǎng)�(luò)友好性的任務(wù)分別由VCL和NAL來完��

  VCL層包括基于塊的運動補償混合編碼和一些新特�。與前面的視頻編碼標(biāo)�(zhǔn)一�,H.264沒有把前處理和后處理等功能包括在草案�,這樣可以增加�(biāo)�(zhǔn)的靈活��

  NAL負責(zé)使用下層�(wǎng)�(luò)的分段格式來封裝�(shù)�(jù),包括組幀、邏輯信道的信令、定時信息的利用或序列結(jié)束信號等。例�,NAL支持視頻在電路交換信道上的傳輸格式,支持視頻在Internet上利用RTP/UDP/IP傳輸?shù)母袷?。NAL包括自己的頭部信息、段�(jié)�(gòu)信息和實際載荷信�,即上層的VCL�(shù)�(jù)。(如果采用�(shù)�(jù)分割技�(shù),數(shù)�(jù)可能由幾個部分組成)�

  2、高精度、多模式運動估計

  H.264支持1/4�1/8像素精度的運動矢�。在1/4像素精度時可使用6抽頭濾波器來減少高頻噪聲,對�1/8像素精度的運動矢�,可使用更為�(fù)雜的8抽頭的濾波器。在進行運動估計�,編碼器還可選擇"增強"�(nèi)插濾波器來提高預(yù)測的效果�

  在H.264的運動預(yù)測中,一個宏塊(MB)可以按�2被分為不同的子塊,形�7種不同模式的塊尺寸。這種多模式的靈活和細致的劃分,更切合圖像中實際運動物體的形狀,大大提高了運動估計的精確程�。在這種方式�,在每個宏塊中可以包含�1�2�4�8�16個運動矢��

  在H.264�,允許編碼器使用多于一幀的先前幀用于運動估計,這就是所謂的多幀參考技�(shù)。例�2幀�3幀剛剛編碼好的參考幀,編碼器將選擇對每個目�(biāo)宏塊能給出更好的�(yù)測幀,并為每一宏塊指示是哪一幀被用于預(yù)測�

  3�4×4塊的整數(shù)變換

  H.264與先前的�(biāo)�(zhǔn)相似,對殘差采用基于塊的變換編碼,但變換是整�(shù)操作而不是實�(shù)運算,其過程和DCT基本相似。這種方法的優(yōu)點在于:在編碼器中和解碼器中允許精度相同的變換和反變�,便于使用簡單的定點運算方式。也就是說,這里沒有"反變換誤�"� 變換的單位是4×4�,而不是以往常用�8×8�。由于用于變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較�,而且在運動物體邊緣處的銜接誤差也大為減小。為了使小尺寸塊的變換方式對圖像中較大面積的平滑區(qū)域不�(chǎn)生塊之間的灰度差�,可對幀�(nèi)宏塊亮度�(shù)�(jù)�16�4×4塊的DC系數(shù)(每個小塊一個,�16個)進行第二�4×4塊的變換,對色度�(shù)�(jù)�4�4×4塊的DC系數(shù)(每個小塊一�,共4個)進行2×2塊的變換�

  H.264為了提高碼率控制的能�,量化步長的變化的幅度控制在12.5%左右,而不是以不變的增幅變�。變換系�(shù)幅度的歸一化被放在反量化過程中處理以減少計算的�(fù)雜性。為了強�(diào)彩色的逼真�,對色度系數(shù)采用了較小量化步長�

  4、統(tǒng)一的VLC

  H.264中熵編碼有兩種方�,一種是對所有的待編碼的符號采用�(tǒng)一的VLC(UVLC :Universal VLC),另一種是采用�(nèi)容自適應(yīng)的二進制算術(shù)編碼(CABAC:Context-Adaptive Binary Arithmetic Coding�。CABAC是可選項,其編碼性能比UVLC稍好,但計算�(fù)雜度也高。UVLC使用一個長度無限的碼字�,設(shè)計結(jié)�(gòu)非常有規(guī)�,用相同的碼表可以對不同的對象進行編碼。這種方法很容易產(chǎn)生一個碼字,而解碼器也很容易地識別碼字的前綴,UVLC在發(fā)生比特錯誤時能快速獲得重同步�

  5、幀�(nèi)�(yù)�

  在先前的H.26x系列和MPEG-x系列�(biāo)�(zhǔn)�,都是采用的幀間預(yù)測的方式。在H.264�,當(dāng)編碼Intra圖像時可用幀�(nèi)�(yù)�。對于每�4×4塊(除了邊緣塊特別處置以外),每個像素都可用17個最接近的先前已編碼的像素的不同加權(quán)和(有的�(quán)值可�0)來�(yù)測,即此像素所在塊的左上角�17個像�。顯�,這種幀�(nèi)�(yù)測不是在時間�,而是在空間域上進行的預(yù)測編碼算法,可以除去相鄰塊之間的空間冗余�,取得更為有效的壓縮�

  6、面向IP和無線環(huán)�

  H.264 草案中包含了用于差錯消除的工�,便于壓縮視頻在誤碼、丟包多�(fā)�(huán)境中傳輸,如移動信道或IP信道中傳�?shù)慕研浴?/FONT>

  為了抵御傳輸差錯,H.264視頻流中的時間同步可以通過采用幀�(nèi)圖像刷新來完�,空間同步由條結(jié)�(gòu)編碼(slice structured coding)來支持。同時為了便于誤碼以后的再同步,在一幅圖像的視頻�(shù)�(jù)中還提供了一定的重同步點。另外,幀�(nèi)宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時候不僅可以考慮編碼效率,還可以考慮傳輸信道的特性�

  除了利用量化步長的改變來適應(yīng)信道碼率�,在H.264�,還常利用數(shù)�(jù)分割的方法來�(yīng)對信道碼率的變化。從總體上說,數(shù)�(jù)分割的概念就是在編碼器中生成具有不同�(yōu)先級的視頻數(shù)�(jù)以支持網(wǎng)�(luò)中的服務(wù)�(zhì)量QoS。例如采用基于語法的�(shù)�(jù)分割(syntax-based data partitioning)方�,將每幀�(shù)�(jù)的按其重要性分為幾部分,這樣允許在緩沖區(qū)溢出時丟棄不太重要的信息。還可以采用類似的時間數(shù)�(jù)分割(temporal data partitioning)方�,通過在P幀和B幀中使用多個參考幀來完��

  在無線通信的應(yīng)用中,我們可以通過改變每一幀的量化精度或空間/時間分辨率來支持無線信道的大比特率變�??墒?,在多播的情況下,要求編碼器對變化的各種比特率進行響應(yīng)是不可能的。因�,不同于MPEG-4中采用的精細分級編碼FGS(Fine Granular Scalability)的方法(效率比較低�,H.264采用流切換的SP幀來代替分級編碼�

  H.264的PSNR(PeakSignaltoNoiseRatio,峰值信噪比)比MPEG-4(ASP)和H.263++(HLP)明顯要�,在6種速率的對比測試中,H.264的PSNR比MPEG-4(ASP)平均要�2dB,比H.263(HLP)平均要�3dB�

與MPEG4區(qū)�

  壓縮方式是DVR的核心技�(shù),壓縮方式很大程度上決定著圖像的�(zhì)�、壓縮比、傳輸效�� 傳輸速度等性能,它是評價DVR性能�(yōu)劣的重要一�(huán)� 隨著多媒體技�(shù)的發(fā)展,相繼推出了許多壓縮編碼標(biāo)�(zhǔn),目前主要有JPEG/M-JPEG� H.261/H.263和MPEG等標(biāo)�(zhǔn)�

  1、JPEG/M-JPEG

  �、JPEG是一種靜止圖像的壓縮�(biāo)�(zhǔn),它是一種標(biāo)�(zhǔn)的幀�(nèi)壓縮編碼方式。當(dāng)硬件處理速度足夠快時,JPEG能用于實時動圖像的視頻壓�。在畫面變動較小的情況下能提供相�(dāng)不錯的圖像質(zhì)量,傳輸速度快,使用相當(dāng)安全,缺點是�(shù)�(jù)量較��

 ?�?、M-JPEG源于JPEG壓縮技�(shù),是一種簡單的幀�(nèi)JPEG壓縮,壓縮圖像質(zhì)量較好,在畫面變動情況下無馬賽克,但是由于這種壓縮本身技�(shù)限制� 無法做到大比例壓�,錄像時每小時約1-2GB空間,網(wǎng)�(luò)傳輸時需�2M帶寬,所以無論錄像或�(wǎng)�(luò)�(fā)送傳�,都將耗費大量的硬盤容量和帶寬,不適合長時� 連續(xù)錄像的需�,不大實用于視頻圖像的網(wǎng)�(luò)傳輸�

  2、H.261/H.263

 ?�?、H.261�(biāo)�(zhǔn)通常稱為P*64,H.261 對全色彩、實時傳輸動圖像可以達到較高的壓縮比,算法由幀�(nèi)壓縮加前后幀間壓縮編碼組合而成,以提供視頻壓縮和解壓縮的快速處理。由于在幀間壓縮算法中� �(yù)測到�1幀,所以在延續(xù)時間上比較有�(yōu)�,但圖像�(zhì)量難以做到很高的清晰度,無法實現(xiàn)大壓縮比和變速率錄像��

  �、H.263的基本編� 方法與H.261是相同的,均為混合編碼方�,但H.263為適�(yīng)極低碼率的傳�,在編碼的各個環(huán)節(jié)上作了改進,如以省碼字來提高編碼圖像的質(zhì)�,此 外,H.263還吸取了MPEG的雙向運動預(yù)測等措施,進一步提高幀間編碼的�(yù)測精度,一般說,在低碼率時,采用H.263只要一半的速率可獲得和 H.261相當(dāng)?shù)膱D像質(zhì)��

  3、MPEG

  MPEG是壓縮運動圖像及其伴音的視音頻編碼標(biāo)�(zhǔn),它采用了幀間壓�,僅存儲連續(xù)幀之間有差別的地方 ,從而達到較大的壓縮�。MPEG�(xiàn)有MPEG�1、MPEG�2和MPEG�4三個版�,以適應(yīng)于不同帶寬和圖像�(zhì)量的要求�

 ?�?、MPEG�1的視頻壓縮算法依賴于兩個基本技�(shù),一是基�16*16(像�*行)塊的運動補償,二是基于變換域的壓縮技�(shù)來減少空域冗余度,壓縮比 相比M-JPEG要高,對運動不激烈的視頻信號可獲得較好的圖像�(zhì)�,但�(dāng)運動激烈時,圖像會�(chǎn)生馬賽克�(xiàn)象� MPEG-1�1.5Mbps的數(shù)�(jù)率傳 輸視音頻信號,MPEG-1在視頻圖像質(zhì)量方面相�(dāng)于VHS錄像機的圖像�(zhì)量,視頻錄像的清晰度的彩色模式≥240TVL,兩路立體聲伴音的�(zhì)量接近CD 的聲音質(zhì)�� MPEG-1是前后幀多幀�(yù)測的壓縮算法,具有很大的壓縮靈活�,能變速率壓縮視頻,可視不同的錄像�(huán)�,設(shè)置不同的壓縮�(zhì)量,從每小時 80MB�400MB不等,但�(shù)�(jù)量和帶寬還是比較��

  �、MPEG-2它是獲得更高分辨率(720*572)提供廣播級的視音頻編碼�(biāo) �(zhǔn)。MPEG-2作為MPEG-1的兼容擴�,它支持隔行掃描的視頻格式和許多性能包括支持多層次的可調(diào)視頻編碼,適合多種質(zhì)量如多種速率和多種分� 率的場合。它適用于運動變化較�,要求圖像質(zhì)量很高的實時圖像。對每秒30幀�720*572分辨率的視頻信號進行壓縮,數(shù)�(jù)率可�3-10Mbps。由 于數(shù)�(jù)量太�,不適合長時間連續(xù)錄像的需��

 ?、邸PEG-4是為移動通信�(shè)備在Internet�(wǎng)實時傳輸視音頻信號而制定的低速率、高� 縮比的視音頻編碼�(biāo)�(zhǔn)� MPEG-4�(biāo)�(zhǔn)是面�?qū)ο蟮膲嚎s方式,不是像MPEG-1和MPEG-2那樣簡單地將圖像分為一些像塊,而是根據(jù)圖像的內(nèi)�� 其中的對象(物體、人�、背景)分離出來,分別進行幀�(nèi)、幀間編�,并允許在不同的對象之間靈活分配碼率,對重要的對象分配較多的字節(jié),對次要的對象分� 較少的字節(jié),從而大大提高了壓縮�,在較低的碼率下獲得較好的效�� MPEG-4支持MPEG-1、MPEG-2中大多數(shù)功能,提供不同的視頻�(biāo)�(zhǔn)源格 式、碼�、幀頻下矩形圖形圖像的有效編��

  總之,MPEG-4有三個方面的�(yōu)勢:

 ?�?、具有很好的兼容��

 ?、凇PEG-4比其他算法提供更好的壓縮�,達200�1�

  �、MPEG-4在提供高壓縮比的同時,對�(shù)�(jù)的損失很小。所�,MPEG-4的應(yīng)用能大幅度的降低錄像存儲容量,獲得較高的錄像清晰�,特別適用于長時間實時錄像的需�,同時具備在低帶寬上�(yōu)良的�(wǎng)�(luò)傳輸能力�

  H.264 是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的�(lián)合視頻組(JVT:joint video team� 開發(fā)的一個新的數(shù)字視頻編碼標(biāo)�(zhǔn),它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分�1998�1月份開始草案� 集,1999�9�,完成個草��2001�5月制定了其測試模式TML-8�2002�6月的 JVT�5次會議通過了H.264的FCD�。目� 該標(biāo)�(zhǔn)還在開發(fā)之中,預(yù)計明年上半年可正式通過�

  H.264和以前的�(biāo)�(zhǔn)一樣,也是DPCM加變換編碼的混合編碼模式。但它采用“回歸基本� 的簡潔設(shè)計,不用眾多的選�,獲得比H.263++好得多的壓縮性能;加強了對各種信道的適應(yīng)能力,采用“網(wǎng)�(luò)友好”的�(jié)�(gòu)和語�,有利于對誤碼和丟包� 處理;應(yīng)用目�(biāo)范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需�;它的基本系�(tǒng)是開放的,使用無需版權(quán)�

  在技�(shù) �,H.264�(biāo)�(zhǔn)中有多個閃光之處,如統(tǒng)一的VLC符號編碼,高精度、多模式的位移估�,基�4×4塊的整數(shù)變換、分層的編碼語法�。這些措施使得 H.264算法具有很的高編碼效率,在相同的重建圖像�(zhì)量下,能夠比H.263節(jié)�50%左右的碼率。H.264的碼流結(jié)�(gòu)�(wǎng)�(luò)適應(yīng)性強,增加了差錯恢復(fù) 能力,能夠很好地適應(yīng)IP和無線網(wǎng)�(luò)的應(yīng)用�

  其實�(xiàn)在多�(shù)的什么H.264都是H.263++通過改進后的算�,是壓縮率變的小了點(包括現(xiàn)在有個別的生�(chǎn)廠家,我同事都看到過他們的源代碼)!如果是從單個畫面清晰度比較,MPEG4有優(yōu)勢;從動作連貫性上的清晰度,H.264有優(yōu)��

視頻壓縮系統(tǒng)

  H.264�(biāo)�(zhǔn)壓縮系統(tǒng)由視頻編碼層(VCL)和�(wǎng)�(luò)提取層(Network Abstraction Layer,NAL)兩部分組成。VCL中包括VCL編碼器與VCL解碼�,主要功能是視頻�(shù)�(jù)壓縮編碼和解�,它包括運動補償、變換編�、熵編碼等壓縮單�。NAL則用于為VCL提供一個與�(wǎng)�(luò)無關(guān)的統(tǒng)一接口,它負責(zé)對視頻數(shù)�(jù)進行封裝打包后使其在�(wǎng)�(luò)中傳�,它采用�(tǒng)一的數(shù)�(jù)格式,包括單個字節(jié)的包頭信�、多個字節(jié)的視頻數(shù)�(jù)與組幀、邏輯信道信令、定時信�、序列結(jié)束信號等。包頭中包含存儲�(biāo)志和類型�(biāo)�。存儲標(biāo)志用于指示當(dāng)前數(shù)�(jù)不屬于被參考的幀。類型標(biāo)志用于指示圖像數(shù)�(jù)的類�。VCL可以傳輸按當(dāng)前的�(wǎng)�(luò)情況�(diào)整的編碼參數(shù)�

一種基于快速運動估計算�

  H�264是現(xiàn)有最重要�(shù)�(jù)壓縮編碼國際�(biāo)�(zhǔn)之一。同時快速運動估計算法一直是視頻壓縮中的研究熱點。本文針對一些快速估計算法過早確定了搜索方向,容易陷入局部最小點,損失了搜索精度的情況,在原有基�(chǔ)�,運用菱形十字搜索算�(DCS)與閾值估計相�(jié)合的方法提高了運動估計的性能。實驗結(jié)果表�,該算法可以用較小的搜索代價取得與全搜索(FS)相當(dāng)?shù)男�?,并且在搜索速度方面?yōu)于鉆石法DS)�

  0 引言

  H�264采用了減少視頻圖像各幀間冗余度的運動估計算�。運動估計算法傳�(tǒng)的有全搜�(FS)、三步搜�(TSS)、新三步搜索(NTSS)、四步搜�(FSS)�;常用的是鉆石搜�(DS)和非對稱十字交叉多層次六邊形格點運動搜索算法(UMHexagonS)。運動估計是整個視頻編碼中運算量的模塊,可占整個軟件編碼器運算量的70%以�。因此視頻系�(tǒng)中編碼器的復(fù)雜部分取決于運動估計算法體系�(jié)�(gòu)的復(fù)雜性�

  1 運動估計算法分析

  1�1 鉆石搜索(DS)算法

  DS算法即鉆石搜索算�,被MPEG-4國際�(biāo)�(zhǔn)采用并收入驗證模型VM(Verification Model)�,是MPEG-4建議采用的快速運動估計算��  DS算法采用了兩種搜索模板,分別是有9個檢測點的大模板和有5個檢測點的小模板。搜索時先用大模板LDSP在搜索區(qū)域中心及周圍8個點處進行匹配計算,當(dāng)最小塊誤差出現(xiàn)在中心點處時,將大模板LDSP換為SDSP,再進行匹配計算,這時5個點中的MBD(Minimum Block Distortion)即為匹配�;否則,改變中心位置,仍用LDSP重復(fù)計算�

  1�2 菱形十字搜索(DCS)算法

  菱形十字搜索算法(DCS)算法是在DS算法基礎(chǔ)上改進而來,DCS的匹配模板是建立在兩種不同的搜索模板之上�,即大菱形十字型(LDCSP)和小菱形十字�(SDCSP),如�1所�。其�,十字型可以對應(yīng)于實際的運動的矢量分�,而交叉型則是為了加速搜索效果�

DSC的搜索模板

  DCS算法在進行運動估計匹配運算�,有三種可能的情況:

  (1)若MBD點位于LDCSP中心位置,說明圖像是靜止�,DCS算法一步結(jié)束;

  (2)若MBD點位于LDCSP小十字位�,說明圖像的運動較小,則在此基礎(chǔ)上按照SDCSP模板反復(fù)進行交叉搜索�

  (3)若MBD點位于LDCSP大十字位置,說明圖像的運動較�,則在此基礎(chǔ)上按照LDCSP模板反復(fù)進行交叉搜索�

  由此可以看出,DCS算法的優(yōu)點是,可以根�(jù)圖像的運動類�(如上述三種情�),白適應(yīng)選擇下一步相�(yīng)的搜索模板,使搜索與圖像�(nèi)容有�(guān)(基于�(nèi)容的搜索),從而得到較好的搜索效果;DCS算法的搜索并不一定要�(jīng)歷模板由大到小的必然過程,有時一步即可完成搜�;用DCS搜索�,十字形模板對應(yīng)于實際的運動矢量分布,交叉形模板則有�(zhǔn)確性“聚焦”特�,這從本質(zhì)上體�(xiàn)了DCS是粗定位和準(zhǔn)確定位的有效�(jié)合�

  2 運動估計的閾值確�

  視頻圖像的運動矢量大部分為零矢量或運動很小的矢量。運動矢量為零的塊稱為靜止塊;運動矢量很小的�(以搜索窗口中心為圓心,兩像素為半徑的圓內(nèi))稱為�(zhǔn)靜止塊:而其他的稱為運動�。如果有超過80%運動矢量很小的塊可被看作靜止或�(zhǔn)靜止塊。因�,可�(shè)一個閥值T,當(dāng)運動矢量的值小于T�,可用SDCSP搜索法直接進行精確定位,找出點;當(dāng)運動矢量的值大于T時,可用LDCSP搜索算法找出��

  運動矢量空間域的�(yù)測方式有運動矢量中值預(yù)�、空間域的上層塊模式運動矢量;在時間域的�(yù)測方式有前幀對應(yīng)塊運動矢量預(yù)測和時間域的鄰近參考幀運動矢量�(yù)�。本文采用運動矢量中值預(yù)測方式。根�(jù)與當(dāng)前E塊相鄰的左邊A�,上邊B塊和右上邊C塊的運動矢量,取中值作為當(dāng)前塊的預(yù)測運動矢�。如�2所示�

匹配塊分布

  �(shè)�(dāng)前要編碼塊E的運動矢量為MVp。如果運動矢量的值MVp≥T,則與E塊相鄰的各塊間運動的相關(guān)性較�,表明該區(qū)域的變化比較平緩;如果運動矢量的值MVp<T,則與E塊相鄰的各塊間運動的相關(guān)性較低,表明該區(qū)域變化比較劇�。通過對missa、grandmother、carphone、salesman的檢測可知,取閾值T=2�

  3 自適�(yīng)運動估計算法

  �(jié)合上述DCS算法和閾值的確定,可采取先對視頻圖像的運動塊進行閾值的判斷,再根據(jù)判斷�(jié)果進行匹配塊的搜索。具體搜索步驟描述如下:

  Step 1:判斷當(dāng)前塊運動矢量MVp和閾值確大小。若MVp≥T,則進入Step 2;若MVp<T,則進入Step 5�

  Step 2:用LDCSP在搜索區(qū)域中心及周圍8個點進行匹配運算,然后判�,找出MBD�。若MBD點位于中心點,說明宏塊是靜止�,DCS算法一步結(jié)�,得到匹配塊;否則進行Step 3�

  Step 3:若MBD點為LDCSP模版的小十字�,以該點為中心構(gòu)建SDCSP進行匹配計算,若MBD點位于中心點,所得MBD點為所�。否�,進入Step 4�

  Step 4:若MBD點為LDCSP模版的大十字�,以該點為中心構(gòu)建LCSP進行匹配計算,進入step 2�

  Step 5:用LDCSP在搜索區(qū)域中心及周圍5個點進行匹配運算,然后判斷,找出MBD�。若MBD點位于中心點,所得MBD點為所�;否則繼�(xù)Step 5。算法流程圖如圖3所��

算法流程圖

  4 實驗�(jié)果及說明

  用搜索時間和PSNR值兩個指�(biāo)來驗證DCS的性能。本節(jié)實驗用到的所有視頻文件均為QCIF(Quartet commonintermediate format)格式。實驗以主頻1�8GHz的PC機上運行的VisualC++6�0為平臺。測試對象為:missa、salesman、news、grandmother、foreman、carphone、claire,搜索范圍為16×16的矩形框,量化范圍為2�12,測試序列中每幀圖像的大小為176×144�

  4�1 搜索時間的比�

  為了時間測試的準(zhǔn)確�,測試時采用的是VC++提供的兩個精確時間函�(shù):QueryPerformanceFrequency()和OuerPerformanceCounter()精度對標(biāo)�(zhǔn)測試序列missa、salesman、news、grandmother、foreman、carphone進行精確測定,得�1(�(shù)�(jù)均為三次測量所求得的平均�)�

搜索時間測試結(jié)果

  從表1可知:a.FS搜索效果,但耗時太長;DS算法有較大改�,可以實�(xiàn)實時壓縮;DCS比DS,運行時間都有不同程度的減少,故DCS算法在搜索速度有優(yōu)�。b.從單個序列來�,DCS算法對missa和salesman時間�(yōu)化最為顯著,分別只占FS算法�7�42��7�50%和DS算法�98�17%�97�49%;對carphone序列的搜索速度也有很大�(yōu)�,占FS搜索算法�7�97%和DS算法�97�82�。綜合視頻特性可知:DCS算法針對運動平緩的視頻對象搜索速度�(yōu)化明��

psnr值比較

  4�2 信噪比的比較

  對標(biāo)�(zhǔn)測試序列claire和carphone序列進行測定,計算PSNR得表2�

  �2中FS的平均PSNR,達�42�38,但搜索時間最�;DS的PSNR,為42�31,而DCS�42�35,高于DS算法,且僅低于FS算法0�03dB。從單個序列來�,DCS算法對claire的優(yōu)化程�,超過了FS的PSNR�,說明DCS算法身體靜止僅面部表情運動特點視頻適�。用DCS算法計算得到的carphone的PSNR值雖然低于FS算法,但高于DS算法;missa序列的DCS算法的PSNR值和FS、DS法的相差不大。故DCS算法在搜索速度、圖像質(zhì)量上均有保證�

  5 �(jié)束語

  本文從搜索時間和圖像�(zhì)量兩方面對各種塊匹配運動估計算法進行了性能分析比較。實驗結(jié)果表明,將菱形十字交叉搜索算法和閾值判斷結(jié)�,在搜索速度方面,有很大程度的優(yōu)�,而且能得到與FS、DS搜索算法相當(dāng)?shù)膱D像質(zhì)量。DCS算法針對運動平緩的視頻作用明�,由此推知該算法適用于電視電�、遠程教育等實時視頻壓縮�

與AVS視頻�(biāo)�(zhǔn)核心技�(shù)比較

  視頻編碼技�(shù)在過去幾年最重要的發(fā)展之一是由ITU和ISO/IEC的聯(lián)合視頻小� (JVT)開發(fā)了H.264/MPEG-4 AVC[8]�(biāo)�(zhǔn)。在�(fā)展過程中,業(yè)界為這種新標(biāo)�(zhǔn)取了許多不同的名�。ITU�1997年開始利用重要的新編碼工具處理H.26L(長期),結(jié)果令人鼓�,于是ISO決定�(lián)手ITU組建JVT并采用一個通用的標(biāo)�(zhǔn)。因�,大家有時會聽到有人將這項�(biāo)�(zhǔn)稱為JVT,盡管它并非正式名稱。ITU�2003�5月批�(zhǔn)了新的H.264�(biāo)�(zhǔn)。ISO�2003�10 月以MPEG-4 Part 10、視頻編碼或AVC的名稱批�(zhǔn)了該�(biāo)�(zhǔn)�

  H.264 實現(xiàn)的改進創(chuàng)造了新的市場機遇

  H.264/AVC在壓縮效率方面取得了巨大突破,一般情況下達到MPEG-2及MPEG-4簡化類壓縮效率的大約2�。在JVT進行的正式測試中,H.264�85個測試案例中�78%的案例實現(xiàn)1.5倍以上的編碼效率提高�77%的案例中達�2倍以�,部分案例甚至高�4倍。H.264 實現(xiàn)的改進創(chuàng)造了新的市場機遇,如�600Kbps的VHS品質(zhì)視頻可以通過ADSL線路實現(xiàn)視頻點播;高清晰電影無需新的激光頭即可適應(yīng)普� DVD�

  H.264�(biāo)�(zhǔn)化時支持三個類別:基本�、主類及擴展類。后來一項稱為高保真范圍擴展 (FRExt)的修訂引入了稱為類的4個附加類。在初期主要是基本類和主類引起了大家的興�?;绢惤档土擞嬎慵跋到y(tǒng)�(nèi)存需�,而且針對低時延進行了優(yōu)�。由于B幀的內(nèi)在時延以及CABAC的計算復(fù)雜�,因此它不包括這兩者。基本類非常適合可視電話�(yīng)用以及其他需要低成本實時編碼的應(yīng)��

  主類提供的壓縮效率,但其要求的處理能力也比基本類高許�,因此使其難以用于低成本實時編碼和低時延�(yīng)�。廣播與�(nèi)容存儲應(yīng)用對主類最感興趣,它們是為了盡可能以的比特率獲得的視頻質(zhì)��

  盡管H.264采用與舊�(biāo)�(zhǔn)相同的主要編碼功�,不過它還具有許多與舊標(biāo)�(zhǔn)不同的新功能,它們一起實�(xiàn)了編碼效率的提高。其主要差別,概述如下:

  幀�(nèi)�(yù)測與編碼:H.264采用空域幀�(nèi)�(yù)測技�(shù)來預(yù)測相鄰塊鄰近像素的Intra-MB中的像素。它對預(yù)測殘差信號和�(yù)測模式進行編碼,而不是編碼塊中的實際像素。這樣可以顯著提高幀�(nèi)編碼效率�

  幀間預(yù)測與編碼:H.264中的幀間編碼采用了舊標(biāo)�(zhǔn)的主要功�,同時也增加了靈活性及可操作�,包括適用于多種功能的幾種塊大小選項,如:運動補償、四分之一像素運動補償、多參考幀、通用 (generalized)雙向�(yù)測和自適�(yīng)�(huán)路去��

  可變矢量塊大?。涸试S采用不同塊大小執(zhí)行運動補�??梢詾樾�?(4的塊傳輸單個運動矢�,因此在雙向�(yù)測情況下可以為單個MB傳輸多達32個運動矢�。另外還支持16(8�8(16�8(8�8(4�4(8的塊大小。降低塊大小可以提高運動細節(jié)的處理能�,因而提高主觀�(zhì)量感�,包括消除較大的塊化失真�

  四分之一像素運動估計:通過允許半像素和四分之一像素運動矢量分辨率可以改善運動補��

  多參考幀�(yù)測:16個不同的參考幀可以用于幀間編�,從而可以改善視頻質(zhì)量的主觀感受并提高編碼效�。提供多個參考幀還有助于提高H.264位流的容錯能�。值得注意的是,這種特性會增加編碼器與解碼器的�(nèi)存需�,因為必須在�(nèi)存中保存多個參考幀�

  自適�(yīng)�(huán)路去塊濾波器:H.264采用一種自適應(yīng)解塊濾波�,它會在�(yù)測回路內(nèi)對水平和垂直區(qū)塊邊緣進行處理,用于消除塊�(yù)測誤差造成的失�。這種濾波通常是基�4(4塊邊界為運算基礎(chǔ),其中邊界各邊的3個像素可通過4級濾波器進行更新�

  整數(shù)變換:采用DCT的早期標(biāo)�(zhǔn)必須為逆變換的固點實施來定義舍入誤差的容差范圍。編碼器與解碼器之間� IDCT 精度失配造成的漂移是�(zhì)量損失的根源。H.264利用整數(shù)4(4空域變換解決了這一問題——這種變換是DCT的近似��4(4的小區(qū)塊還有助于減少阻塞與振鈴失真�

  量化與變換系�(shù)掃描:變換系�(shù)通過�(biāo)量量化方式得到量�,不�(chǎn)生加大的死區(qū)。與之前的標(biāo)�(zhǔn)類似,每個MB都可選擇不同的量化步�,不過步長以大約12.5%的�(fù)合速率增加,而不是固定遞�。同時,更精細的量化步長還可以用于色度成�,尤其是在粗劣量化光度系�(shù)的情況下�

  熵編碼:與根�(jù)所涉及的數(shù)�(jù)類型提供多個靜�(tài)VLC表的先前�(biāo)�(zhǔn)不同,H.264針對變換系數(shù)采用上下文自適應(yīng)VLC,同時針對所有其他符號采用統(tǒng)一的VLC (UniversalVLC)方法。主類還支持新的上下文自適應(yīng)二進制算術(shù)編碼� (CABAC)。CAVLC�(yōu)于以前的VLC實施,不過成本卻比VLC��

  CABAC利用編碼器和譯碼器的機率模型來處理所有語法元� (syntax elements),包括:變換系數(shù)和運動矢量。為了提高算�(shù)編碼的編碼效�,基本概率模型通過一種稱為上下文建模的方法對視頻幀�(nèi)不斷變換的統(tǒng)計進行適應(yīng)。上下文建模分析提供編碼符號的條件概率估計�。只要利用適�(dāng)?shù)纳舷挛哪�?,就能根?jù)待編碼符號周圍的已編碼符�,在不同的概率模型間進行切換,進而充份利用符號間的冗余性。每個語法元素都可以保持不同的模型(例如,運動矢量和變換系數(shù)具有不同的模型)。相較于VLC熵編碼方� (UVLC/CAVLC),CABAC 能多節(jié)�10%bit速率�

  加權(quán)�(yù)測:它利用前向和后向�(yù)測的加權(quán)總和建立對雙向內(nèi)插宏模塊的預(yù)�,這樣可以提高場景變化時的編碼效率,尤其是在衰落情況下�

  保真度范圍擴展:2004�7�,H.264�(biāo)�(zhǔn)增加了稱為保真度范圍擴展 (FRExt) [11]的新修訂。這次擴展在H.264中添加了一整套工具,而且允許采用附加的色域、視頻格式和位深�。另外還增加了對無損幀間編碼與立體顯示視頻的支持。FRExt修訂版在H.264中引入了4種新�,即�

  ?High Profile (HP):用于標(biāo)�(zhǔn) 4:2:0色度采樣,每分量8位彩�。此類引入了新的工具—� 隨后詳述�

  ?High 10 Profile (Hi10P):用于更高清晰度視頻顯示的標(biāo)�(zhǔn) 4:2:0 色度采樣�10位彩��

  ?High 4:2:2 10 bit color profile (H422P):用于源編輯功能�

  ?High 4:4:4 12 bit color profile (H444P):品�(zhì)的源編輯與色彩保真度,支持視頻區(qū)域的無損編碼以及與新的整�(shù)色域變換(從RGB到Y(jié)UV及黑色)�

  在新的應(yīng)用領(lǐng)域中,H.264 HP對廣播與DVD尤為有利。某些試驗顯示出H.264 HP的性能比MPEG2 提高�3�。下面介紹H.264 HP中引入的主要附加工具�

  自適�(yīng)殘差塊大小與整數(shù)8(8變換:用于變換編碼的殘差塊可以在8(8�4(4之間切換。引入了用于8(8塊的�16位整�(shù)變換。較小的塊仍然可以采用以前的4(4變換�

  8(8亮度幀�(nèi)�(yù)測:增加�8種模�,除之前�16(16�4(4塊以�,使亮度�(nèi)部宏模塊還能�?qū)?(8塊進行幀�(nèi)�(yù)測�

  量化加權(quán):用于量�8(8變換系數(shù)的新量化加權(quán)矩陣�

  單色:支持黑/白視頻編碼�

  AVS

  2002 �,中國信息產(chǎn)�(yè)部成立的音視頻技�(shù)�(biāo)�(zhǔn) (AVS)工作組宣布準(zhǔn)備針對移動多媒體、廣�、DVD等應(yīng)用編寫一份國家標(biāo)�(zhǔn)。該視頻�(biāo)�(zhǔn)稱為AVS [14],由兩個相�(guān)部分組成針對移動視頻�(yīng)用的AVS-M和針對廣播與DVD的AVS1.0。AVS�(biāo)�(zhǔn)與H.264相似�

  AVS1.0同時支持隔行和逐行掃描模式。AVS中P幀可以利用2幀的前向參考幀,同時允許B幀采用前后各一個幀。在隔行模式��4個場可以用作參考。可以僅在幀級執(zhí)行隔行模式中的幀/場編碼,這一點與H.264不同,其中允許此選項的MB級自適應(yīng)。AVS具有與H.264相似的環(huán)路濾波器,可以在幀級關(guān)�。另�,B幀還無需�(huán)路濾波器。幀�(nèi)�(yù)測是�8(8塊為單位進行。MC允許對亮度塊進行1�4象素補償。ME的塊大小可以�16(16�16(8�8(16�8(8。變換方式是基于16位的8(8整數(shù)變換(與WMV9相似�。VLC是基于上下文自適�(yīng)2D運行/級別編�。采�4個不同的Exp-Golomb編碼。用于每個已量化系數(shù)的編碼自適應(yīng)到相�8(8塊中前面的符�。由于Exp-Golomb表是參數(shù)化的�,因此表較小。用于逐行視頻序列的AVS 1.0的視頻質(zhì)量在相同比特率時稍遜于H.264主類�

  AVS-M主要針對移動視頻�(yīng)�,與H.264基本�(guī)范存在交�。它僅支持逐行視頻、I與P幀,不支持B幀。主要AVS-M編碼工具包括基于4(4塊的幀�(nèi)�(yù)��1/4象素運動補償、整�(shù)變換與量化、上下文自適�(yīng)VLC以及高度簡化的環(huán)路濾波器。與H.264基本�(guī)范相似AVS-M中的運動矢量塊大小降�4(4,因此MB可擁有多�16個運動矢�。采用多幀�(yù)測,但僅支持2個參考幀。此�,AVS-M中還定義了H.264 HRD/SEI消息的子集。AVS-M的編碼頻率約�0.3dB,在相同�(shè)置下稍遜于H.264基本�(guī)�,而解碼器的復(fù)雜性卻降低了大�20��

  H.264和AVS的背�

  H.264/MPEG-4AVC是ITU-T的VCG(Video Coding Experts Group)和ISO/IEC的MPEG(Moving Picture Experts Group)�(lián)合開�(fā)的新一代視頻編碼標(biāo)�(zhǔn)。應(yīng)用范圍包括可視電話、視頻會議等。H.264的主要特色就是極大得提高了壓縮率,是MPEG-2及MPEG-4壓縮效率的一倍以�。H.264核心技�(shù)與之前標(biāo)�(zhǔn)相同,仍采用基于�(yù)測變換的混合編碼框架,但是在細節(jié)的實�(xiàn)上有很大不同,就是細節(jié)上的改進導(dǎo)致壓縮效率極大得提高。而且新一代視頻編碼標(biāo)�(zhǔn)H.264具有良好的網(wǎng)�(luò)適應(yīng)性和容錯等特��

  AVS的誕生可以說是一個歷史的機遇,面對H.264以及MPEG-2等標(biāo)�(zhǔn)高額的專利費,我國數(shù)字視頻產(chǎn)�(yè)面臨嚴重挑戰(zhàn)。加上我國致力于提高國內(nèi)�(shù)字音視頻�(chǎn)�(yè)的核心競爭力,由國家信息�(chǎn)�(yè)部科�(xué)技�(shù)司于2006�6月批�(zhǔn)成立了“數(shù)字音視頻編解碼技�(shù)�(biāo)�(zhǔn)工作組�,聯(lián)合國�(nèi)從事�(shù)字音視頻編解碼技�(shù)研發(fā)的科研機�(gòu)和企�(yè),針對我國音視頻�(chǎn)�(yè)的需�,提出了我國自主知識�(chǎn)�(quán)的信源編碼標(biāo)�(zhǔn)―――《信息技�(shù) 先進音視頻編碼》系列標(biāo)�(zhǔn),簡稱AVS(audio video coding standard).自主的AVS�(biāo)�(zhǔn)在技�(shù)和性能上處于國際先進水平,如果抓住這次機遇,我國在技�(shù)-專利-�(biāo)�(zhǔn)-芯片-系統(tǒng)-產(chǎn)�(yè)這個產(chǎn)�(yè)鏈上,就有可能具有全面的主動�(quán)�

  H.264和AVS核心技�(shù)分析及對�

  H.264和以前的�(biāo)�(zhǔn)一�,還是采用的混合編碼的框�,AVS視頻�(biāo)�(zhǔn)采用了與H.264類似的技�(shù)框架,包括變�、量�、熵編碼、幀�(nèi)�(yù)�、幀間預(yù)測、環(huán)路濾波等模塊。他們核心技�(shù)的不同包括以下幾點:

  一、變換和量化

  H.264對殘差數(shù)�(jù)采用基于塊的變換編碼,去除原始圖像的空間冗余,使圖像能力集中在小部分系數(shù)�,直流系�(shù)值一般來說是的,這樣可以提高壓縮�、增強抗干擾能力。先前標(biāo)�(zhǔn)一般采用DCT變換,這種變換的缺點是會出�(xiàn)失配�(xiàn)�,原始數(shù)�(jù)�(jīng)過變換和反變換恢�(fù)后會有一個差�,由于是實數(shù)運算計算量也比較�。H.264采用的是基于4×4塊的整數(shù)變換�

  AVS采用8×8的整�(shù)變換,可以在16位處理器上無失配地實�(xiàn)。對高分辨率的視頻圖像去相關(guān)性要�4×4變換有效,采用了64級量�,可以適�(yīng)不同的應(yīng)用和�(yè)�(wù)對碼流和�(zhì)量的要求�

  二、幀�(nèi)�(yù)�

  H.264和AVS技�(shù)都采用幀�(nèi)�(yù)測的方式,用相鄰的像素預(yù)測當(dāng)前塊,采用代表空間域紋理的多種預(yù)測模�。H.264的亮度預(yù)測有4×4塊和16×16�2種預(yù)測方�,對�4×4的塊:從�135度到�22.5度方向加上一個直流預(yù)測一共是9種預(yù)測方向;對于16×16塊:�4種預(yù)測方�。色度預(yù)測是8×8塊,�4種預(yù)測模�,類似于幀�(nèi)16×16�(yù)測的4種模�,其中DC為模�0、水平為模式1、垂直為模式2、平面為模式3�

  三、幀間預(yù)�

  H.264幀間預(yù)測是利用以編碼視頻幀和基于塊的運動補�?shù)念A(yù)測模�,與以往�(biāo)�(zhǔn)幀間預(yù)測的區(qū)別在于塊尺寸范圍更廣、亞像素運動矢量的使用和多參考幀的運用�

  H.264�16×16�16×8�8×16�8×8�8×4�4×8�4×4一�8種宏塊及子宏塊劃�,而AVS只有16×16�16×8�8×16�8×8一�4種宏塊劃分方��

  H.264支持使用多個不同的參考幀對幀間宏塊和片進行�(yù)測,AVS中P幀可以利用至多2幀的前向參考幀,B幀采用前后各一個參考幀�

  �、熵編碼

  H.264制定了基于信息量的熵編碼效率,一種是對所有的待編碼的符號采用�(tǒng)一的可變長編碼(UVLC�,另一種是采用基于�(nèi)容的自適�(yīng)二進制算術(shù)編碼(CABAC, Context-Adaptive Binary Arithmetic Coding�,大大減少了塊編碼相�(guān)性冗�,提高了編碼效率。UVLC計算�(fù)雜度較低,主要針對對編碼時間很嚴格的�(yīng)�,缺點就是效率低,碼率較高。CABAC是一種效率很高的熵編碼方法,其編碼效率比UVLC編碼�50%�

  AVS熵編碼采用自適應(yīng)變長編碼技�(shù)。在AVS熵編碼過程中,所有的語法元素和殘差數(shù)�(jù)都是以指�(shù)哥倫布碼的形式映射成二進制比特��

  采用指數(shù)哥倫布碼的�(yōu)勢在于:一方面,它的硬件復(fù)雜度比較�,可以根�(jù)閉合公式解析碼子,無需查表;另一方面,它可以根據(jù)編碼元素的概率分布靈活地確定以K階指�(shù)哥倫布碼編碼,如果K選得恰當(dāng),則編碼效率可以逼近信息��

  對預(yù)測殘差的塊變換系�(shù),經(jīng)掃描形成(level、run)對�,level、run不是獨立事件,而存在著很強的相�(guān)�,在AVS中l(wèi)evel、run采用二維�(lián)合編碼,并根�(jù)�(dāng)前l(fā)evel、run的不同概率分布趨�,自適應(yīng)改變指數(shù)哥倫布碼的階數(shù)�

  另外,在AVS中沒有SI、SP幀??梢赃@樣說,AVS是在H.264的基�(chǔ)上發(fā)展起來的,吸收了H.264的精�,但為了繞過專利的困擾,又不得不放棄H.264的一些核心算�。換

  來的代價就是,編碼效率稍微降低一點的情況下,�(fù)雜度極大得降低了�

  AVS是我國自主知識產(chǎn)�(quán)的標(biāo)�(zhǔn),現(xiàn)在還沒有大規(guī)模使用,處在起步階段。大多數(shù)企業(yè)處于觀望狀�(tài),沒有資金大量投入,面臨重重困難,但是它的廣闊前景是不容忽視�,又有國家的大力支持,一定會�(fā)展的更加完美�