本科畢業(yè)設(shè)計(jì)(論文) 視頻壓縮中基于快匹配算法的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)1
《本科畢業(yè)設(shè)計(jì)(論文) 視頻壓縮中基于快匹配算法的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)1》由會(huì)員分享,可在線閱讀,更多相關(guān)《本科畢業(yè)設(shè)計(jì)(論文) 視頻壓縮中基于快匹配算法的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)1(50頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、 西 南 交 通 大 學(xué) 本科畢業(yè)設(shè)計(jì)(論文) 視頻壓縮中基于快匹配算法的 運(yùn)動(dòng)補(bǔ)償預(yù)測(cè) BLOCK MATCHING ALGORITHM BASED ON THE FORECASTING MOTION COMPENSATION VIDEO COMPRESSION 2011年06月 承 諾 本人鄭重承諾:所呈交的設(shè)計(jì)(論文)是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行設(shè)計(jì)(研究)所取得的成果,除文中特別加以標(biāo)注引用的內(nèi)容外,本文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫的設(shè)計(jì)(研究)成果。對(duì)本設(shè)
2、計(jì)(研究)做出貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。如被發(fā)現(xiàn)設(shè)計(jì)(論文)中存在抄襲、造假等學(xué)術(shù)不端行為,本人愿承擔(dān)一切后果。 學(xué)生簽名: 年 月 日 西南交通大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 第I頁 院 系 計(jì)算機(jī)與通信工程系 專 業(yè) 通信工程 年 級(jí) 2007級(jí)1班
3、 姓 名 李 波 題 目 視頻壓縮中基于塊匹配算法的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè) 指導(dǎo)教師 評(píng) 語
4、
5、 指導(dǎo)教師 (簽章) 評(píng) 閱 人 評(píng) 語
6、
7、 評(píng) 閱 人 (簽章) 成 績(jī)
8、 答辯委員會(huì)主任 (簽章) 年 月 日
9、 西南交通大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 第IV頁 畢業(yè)設(shè)計(jì)(論文)任務(wù)書 班 級(jí) 07計(jì)通本一班 學(xué)生姓名 李波 學(xué) 號(hào) 20078191 發(fā)題日期:2011 年 2 月 28 日 完成日期:2011 年 6 月 24 日 題 目 視頻壓縮中基于塊匹配算法的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè) 1、本論文的目的、意義 運(yùn)動(dòng)補(bǔ)償?shù)幕?/p>
10、思想是將圖像序列的每一幀分成許多互不重疊的宏塊,并認(rèn)為宏塊內(nèi)所有象素的位移量都相同,然后對(duì)每個(gè)宏塊到參考幀某一給定特定搜索范圍內(nèi)根據(jù)一定的匹配準(zhǔn)則找出與當(dāng)前塊最相似的塊,即匹配塊,匹配塊與當(dāng)前塊的相對(duì)位移即為運(yùn)動(dòng)矢量。視頻壓縮的時(shí)候,只需保存運(yùn)動(dòng)矢量和殘差數(shù)據(jù)就可以完全恢復(fù)出當(dāng)前塊 。高精度的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)可以大大提高視頻編碼的效率,是視頻編碼中的重要環(huán)節(jié)。
11、
12、 2、學(xué)生應(yīng)完成的任務(wù) (1)了解運(yùn)動(dòng)補(bǔ)償?shù)哪康囊饬x和發(fā)展史; (2)掌握MATLAB仿真工具; (3)對(duì)基于塊匹配算法的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)方法進(jìn)行仿真; (4)要求所編制的軟件在答辯時(shí)演示;
13、 (5)嚴(yán)格按照格式要求完成設(shè)計(jì)論文的排版打印,字?jǐn)?shù)不少于1.8萬字; (6)應(yīng)完成不少于一萬英文字符的翻譯及將畢業(yè)設(shè)計(jì)(論文)的中文摘要翻譯成英文。 3、論文各部分內(nèi)容及時(shí)間分配:(共 17 周) 第一部分 熟悉設(shè)計(jì)題目功
14、能要求 ( 3周) 第二部分 掌握MATLAB仿真工具 ( 3周) 第三部分 對(duì)運(yùn)動(dòng)補(bǔ)償?shù)娜剿阉鞣椒ㄟM(jìn)行仿真 ( 5周) 第四部分 完成外文摘要翻譯外文資料 ( 2周) 第五部分 畢業(yè)設(shè)計(jì)文本打印裝訂善后 ( 2周) 評(píng)閱及答辯 ( 1周) 論文整理 ( 1周) 備
15、注 答辯前應(yīng)向指導(dǎo)老師交畢業(yè)設(shè)計(jì)(論文)說明書(書面文檔應(yīng)不少于1萬8千個(gè)漢字)和電子文檔(含畢業(yè)設(shè)計(jì)(論文)說明書及應(yīng)用軟件)。
16、 指導(dǎo)教師: 年 月 日 審 批 人: 年 月 日 摘要 多媒體技術(shù)在人們的生活中應(yīng)用得越來越廣泛,隨著互聯(lián)網(wǎng)的快速發(fā)展,多媒體通信更是成為人們必不可少的需求。多媒體技術(shù)的飛速發(fā)展,使得許多應(yīng)用領(lǐng)域?qū)σ曨l圖像的實(shí)時(shí)壓縮提出了更高的要求,快速、高效的壓縮算法是解決這一問題的關(guān)鍵。 影響視頻壓縮編碼質(zhì)量和效率的因素很多,運(yùn)動(dòng)估計(jì)是其中最有影響力的因素之一。運(yùn)動(dòng)估計(jì)得越準(zhǔn)確,視頻壓縮編碼的效率就越高,解碼出來的視頻圖像質(zhì)量越好;而且,運(yùn)動(dòng)估計(jì)在整個(gè)視頻壓縮編碼系統(tǒng)中的計(jì)算復(fù)雜度最大
17、。因此,快速、高效的運(yùn)動(dòng)估計(jì)算法是視頻壓縮編碼技術(shù)的研究重點(diǎn)。采用運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償技術(shù)可以消除視頻信號(hào)的時(shí)間冗余,從而提高編碼效率。研究設(shè)計(jì)高效、快速、魯棒的運(yùn)動(dòng)估計(jì)算法成為目前視頻壓縮技術(shù)中研究的重要課題。在各種運(yùn)動(dòng)估計(jì)方法中,塊匹配法由于其原理簡(jiǎn)單、便于實(shí)現(xiàn)等優(yōu)點(diǎn)得到了普遍應(yīng)用,被許多視頻編碼標(biāo)準(zhǔn)(如MPEG以及TH.26X)所采用,在理論研究和實(shí)踐應(yīng)用中,得到了不斷的發(fā)展和完善,成為數(shù)字視頻技術(shù)的一個(gè)研究熱點(diǎn)。其相關(guān)快速算法也得到了廣泛的研究和發(fā)展。 本論文中,主要的任務(wù)是分析和研究幾種經(jīng)典的運(yùn)動(dòng)估計(jì)算法,并對(duì)它們進(jìn)行相關(guān)比較。本文首先介紹了課題的研究背景與意義以及視頻壓縮技術(shù),然后
18、闡述了基于塊匹配的運(yùn)動(dòng)估計(jì)的基本原理,最后詳細(xì)介紹了全搜索法和幾種典型的塊匹配運(yùn)動(dòng)估計(jì)快速算法,分析了它們各自的技術(shù)特點(diǎn),通過實(shí)驗(yàn)數(shù)據(jù)定量地評(píng)價(jià)了各算法的優(yōu)缺點(diǎn)。 文章最后對(duì)本文工作進(jìn)行了總結(jié),并對(duì)未來的研究方向進(jìn)行了展望。 關(guān)鍵詞: 運(yùn)動(dòng)估計(jì);塊匹配;三步搜索法 西南交通大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 第40頁 Abstract With the rapid development of the Internet, multimedia technology i
19、s used more and more widely in our daily life, and multimedia communication has become a necessity. With the rapid development of multimedia technology , which puts forward higher request to real-time compression of video image in application fields, rapid and high efficient compression algorithm is
20、 the key to solve this problem. There are many factors which affect the quality and efficiency of video compression coding, and motion estimation is one of the most influential factors. The more precise of motion estimation and the higher efficiency of video compression coding, the better quality o
21、f the decoding video image; Furthermore,in the whole video compression coding system, calculative complexity of motion estimation is the largest. Therefore, rapid and high efficient motion estimation algorithm is the point of research of video compression coding technology. The motion estimation and
22、 motion compensation technology can eliminate time redundancy of the video signal, so as to improve the coding efficiency. Studying and designing the efficient, fast and robust motion estimation algorithm has been the important issue of study for the present video compression techniques. In all kind
23、s of motion estimation methods, motion estimation is used widely because of its advantages such as simple principle, easy to realize ,and is adopted by many video coding standard, such as the MPEG and TH. 26 X. And in the theoretical research and practical application, it has become a hot research t
24、opic in the field of digital video technology getting continuous development and improvement. The fast relevant algorithm also gets extensive research and development. In this paper, the main task is to analyze and study several classical motion estimation algorithms and make a comparison among th
25、em. This paper introduces the research background and significance of the topic and video compression technology at first, then expounds the principle of the motion estimation based on block matching . Finally, introduces the full search method and several typical kinds of fast algorithm of block m
26、atching motion estimation, analyses their technical characteristics, and evaluates their advantages and disadvantages of the algorithm quantitatively according to experimental data . At the end of this paper, we summarize the whole work and prospect the research direction in the future. Keywords:
27、motion estimation; Block matching; Three-step search method 目 錄 第1章 緒論 1 1.1 引言 1 1.1.1 課題的背景與意義 1 1.1.2 視頻壓縮技術(shù)介紹 3 1.2 運(yùn)動(dòng)估計(jì)的研究現(xiàn)狀 7 1.3 本文主要內(nèi)容和工作安排 7 第2章 運(yùn)動(dòng)估計(jì)概述及其技術(shù)指標(biāo) 9 2.1 運(yùn)動(dòng)估計(jì) 10 2.2 塊匹配運(yùn)動(dòng)估計(jì)的基本原理 12 2.3 塊匹配的運(yùn)動(dòng)估計(jì)的參數(shù)和指標(biāo) 14 2.3.1 分塊大小 14 2.3.2 匹配準(zhǔn)則 14 2.3.3 搜索范圍的確定 15 2.3.4 估計(jì)精度 16
28、2.4 算法評(píng)定指標(biāo) 16 第3章 典型塊匹配運(yùn)動(dòng)估計(jì)算法分析 18 3.1全搜索法(FS) 18 3.2 快速匹配算法 19 3.2.1 三步搜索法(FSS) 19 3.2.2 新三步搜索法(NTSS) 21 3.2.3 四步搜索法(FSS) 24 3.2.4 鉆石搜索法(DS) 25 3.2.5 六邊形搜索法(HEXBS) 27 3.3 運(yùn)動(dòng)估計(jì)算法仿真 30 3.3.1 實(shí)驗(yàn)平臺(tái) 30 3.3.2 三步搜索法仿真示例 31 3.3.3 實(shí)驗(yàn)結(jié)果 33 3.3.4 實(shí)驗(yàn)結(jié)果分析 35 3.4 本章小結(jié) 35 結(jié)束語 37 4.1 本文工作總結(jié) 37 4.2
29、 研究展望 37 致謝 39 參考文獻(xiàn) 40 第1章 緒論 1.1 引言 1.1.1 課題的背景與意義 隨著信息技術(shù)的發(fā)展和社會(huì)的不斷進(jìn)步,人類對(duì)信息的需求越來越豐富,人們希望無論何時(shí)何地都能夠方便、快捷、靈活的通過語音、數(shù)據(jù)、圖像與視頻等多種方式進(jìn)行通信。視覺信息給人們直觀、生動(dòng)的形象,圖像/視頻的傳輸更受到廣泛的關(guān)注。數(shù)字信號(hào)處理技術(shù)、物理媒體與網(wǎng)絡(luò)技術(shù)、超大規(guī)模集成電路技術(shù)突飛猛進(jìn)的發(fā)展,使得多媒體通信成為研究和應(yīng)用的熱點(diǎn)。其中,最為關(guān)鍵的技術(shù)是數(shù)字視頻的處理和傳輸技術(shù),它將電視技術(shù)、計(jì)算機(jī)技術(shù)和通信技術(shù)結(jié)合在一起,在電視系統(tǒng)、計(jì)算機(jī)網(wǎng)絡(luò)和通信產(chǎn)業(yè)中得到了廣泛的應(yīng)用,
30、己經(jīng)進(jìn)入千家萬戶的日常生活中。 數(shù)字視頻硬件方面的進(jìn)步和有關(guān)數(shù)字視頻壓縮國(guó)際標(biāo)準(zhǔn)的推出,使得數(shù)字視頻技術(shù)領(lǐng)域趨于成熟。自20世紀(jì)90年代以來,國(guó)際電聯(lián)ITU和國(guó)際標(biāo)準(zhǔn)化組織ISO先后頒布了一系列視頻編碼和多媒體視頻通信的建議和國(guó)際標(biāo)準(zhǔn)。如ISO/IEC成立了JPEG (Joint Photographic Expert Group)和MPEG(Moving Pieture Experts Group)并先后完成了JPEG、JPEG2000、MPEG-l、MPEG-2和MPEG-4標(biāo)準(zhǔn)的制定;ITU-T也先后制定了H.261、H.262(與MPEG組織合作)、H.263/H.263+和H.26
31、4(與MPEG組織合作)等一系列國(guó)際數(shù)字視頻壓縮編碼標(biāo)準(zhǔn)。它們?yōu)橐曨l編碼技術(shù)的發(fā)展起到了巨大的推動(dòng)作用。 在傳統(tǒng)的圖像通信領(lǐng)域,例如基于ISDN、PSTN以及DDN的會(huì)議電視和可視電話等視頻通信業(yè)務(wù)取得巨大成功的同時(shí),新的多媒體通信方式也不斷出現(xiàn),尤其是Internet和數(shù)字移動(dòng)通信的迅速普及,利用IP網(wǎng)絡(luò)以及寬帶無線網(wǎng)絡(luò)進(jìn)行圖像和視頻信息的傳輸成為倍受人們重視的新方式。但是大量頻繁的圖像、視頻信息的交流與存貯活動(dòng)也帶來了許多新要求和新問題,例如視頻圖像巨大的信息量與當(dāng)前有限的信道帶寬和傳輸效率已成為制約多媒體技術(shù)發(fā)展的一個(gè)重要瓶頸,因此人們?cè)谂υ黾有诺缼捄吞岣咝诺纻鬏斝实耐瑫r(shí),對(duì)視頻
32、圖像采取高效的壓縮編碼己成為目前的研究熱點(diǎn)。例如,1幅640x450分辨率的彩色圖像(24比特/像素),其數(shù)據(jù)量約為0.92MB,如果以每秒30幀的速度播放,則視頻信號(hào)的傳輸速率高達(dá)27.6Mbps,如果存放在容量為650MB的光盤中,在不考慮音頻信號(hào)的情況下,每張光盤也只能播放24秒。由此可見,數(shù)字視頻信息的數(shù)據(jù)量是非常巨大的,若不經(jīng)過壓縮,數(shù)字圖像傳輸所需要的高傳輸速率和數(shù)字圖像存儲(chǔ)所需要的巨大容量將成為推廣應(yīng)用數(shù)字視頻技術(shù)的最大障礙。要解決多媒體信息存儲(chǔ)容量大、數(shù)據(jù)傳輸率高的難題,就需要采用壓縮技術(shù)。 研究發(fā)現(xiàn),圖像數(shù)據(jù)表示中存在大量的冗余。通過去除那些冗余數(shù)據(jù)可以使原始圖像數(shù)據(jù)極大的
33、減少,從而解決圖像數(shù)據(jù)量巨大的問題。對(duì)于靜態(tài)圖像,最主要的數(shù)據(jù)冗余是空間冗余。圖像幀記錄了可見景物的顏色,而同一景物各采樣點(diǎn)的顏色之間存在著空間連貫性,但基于離散像素采樣來表示物體顏色的方法通常沒有利用景物表示顏色的這種空間連貫性,因此產(chǎn)生了空間冗余。序列圖像幀內(nèi)存在空間冗余,而幀間則存在著很大的時(shí)間冗余。這是由于序列圖像一般是位于同一時(shí)間軸區(qū)間內(nèi)的一組連續(xù)畫面,其相鄰幀間變化量一般很小,只是表現(xiàn)為移動(dòng)物體所在的空間位置略微不同。運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償技術(shù)就是解決圖像幀間時(shí)間冗余的很好的方法。 運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償是現(xiàn)階段視頻壓縮編碼的關(guān)鍵技術(shù)。它是一種實(shí)現(xiàn)幀間編碼的方法,利用前后兩幀或若干幀之間
34、的時(shí)間相關(guān)性,去除時(shí)間冗余度。幀間編碼之所以能減少冗余度,是因?yàn)樵谝话阋曨l序列的兩幀之間有很大的空間結(jié)構(gòu)相似性,前后兩幀的差幀可以用比幀內(nèi)編碼所需少很多的比特?cái)?shù)來進(jìn)行編碼。而幀間預(yù)測(cè)的方法基本上是以基于塊匹配的運(yùn)動(dòng)估計(jì)(補(bǔ)償)算法為主。 運(yùn)動(dòng)估計(jì)目前面臨的主要問題就是如何比較快速的得到比較準(zhǔn)確的運(yùn)動(dòng)矢量,因?yàn)樵谡麄€(gè)視頻編碼的過程中,即使采用快速算法,運(yùn)動(dòng)估計(jì)仍然是耗時(shí)最長(zhǎng)、資源占用最高的環(huán)節(jié),如在H.261的編碼過程中,在采用著名的三步快速搜索法的情況下,運(yùn)動(dòng)估計(jì)仍要占用整個(gè)編碼過程的63%的計(jì)算量;而在H.263編碼器中,運(yùn)動(dòng)估計(jì)也還占用了42%的計(jì)算量。因此,運(yùn)動(dòng)估計(jì)成了視頻壓縮編碼的瓶
35、頸,特別是對(duì)于幀幅較大、幀頻較高的視頻對(duì)象,在編碼實(shí)時(shí)性和硬件實(shí)現(xiàn)方面,運(yùn)動(dòng)估計(jì)還有很多潛力可挖?;谏鲜鲈?,高效快速的運(yùn)動(dòng)估計(jì)算法一直是視頻壓縮編碼領(lǐng)域的研究熱點(diǎn)。從全搜索到三步搜索法、菱形搜索、以及六邊形搜索法等,提高了基于塊匹配的運(yùn)動(dòng)估計(jì)算法的性能,使實(shí)時(shí)應(yīng)用成為了可能,但是由于實(shí)際需求越來越高,所以也要求我們不斷的改進(jìn)運(yùn)動(dòng)估計(jì)算法以滿足現(xiàn)實(shí)的需求。 基于塊匹配的運(yùn)動(dòng)估計(jì)作為視頻編碼的關(guān)鍵技術(shù),需要解決的問題是如何提高它的估算速度和精度。而魚和熊掌不能兼得,這兩個(gè)指標(biāo)在實(shí)際計(jì)算過程中往往無法同時(shí)達(dá)到最優(yōu),如何解決這個(gè)折衷問題具有很高的理論和實(shí)際意義,是一個(gè)圖像處理領(lǐng)域和圖像通信領(lǐng)域極
36、其重要的研究課題。它的研究和應(yīng)用必將促進(jìn)計(jì)算機(jī)通信、圖像通信和多媒體技術(shù)的發(fā)展。 本課題的意義在于,通過實(shí)驗(yàn)和仿真,比較了各種算法的優(yōu)缺點(diǎn),找出了最優(yōu)的算法,確保視頻壓縮的質(zhì)量。力求在己有算法的基礎(chǔ)上尋找一種新的思路,找出了一種優(yōu)化和改進(jìn)的塊匹配運(yùn)動(dòng)估計(jì)算法,使其能夠在保證圖像質(zhì)量的同時(shí),搜索速度得到較大的提高。 1.1.2 視頻壓縮技術(shù)介紹 對(duì)視頻進(jìn)行壓縮,就要了解視頻的構(gòu)成。普通的未壓縮視頻都是由一幀幀圖像序列組成的,一般1秒中包含24幀圖像。一般圖像的變化都很小,而且變化都是局部的,甚至是靜止的,這樣就可以從中找到突破。數(shù)字視頻中的這些情況都可以稱為信息的冗余,因此可以通過除去這些
37、冗余數(shù)據(jù)來減少大量的原始視頻的數(shù)據(jù)量,從而達(dá)到數(shù)據(jù)壓縮以解決視頻傳輸中數(shù)據(jù)不便傳輸?shù)膯栴}。通常的視頻信息中存在以下三種冗余:[1] 空間冗余:這是靜態(tài)圖像存在的最主要的一種數(shù)據(jù)冗余。研究數(shù)據(jù)表明,圖像幀內(nèi)的行、列相鄰點(diǎn)之間的相關(guān)性可以達(dá)到90%以上。 時(shí)間冗余:這是視頻里圖像序列中最經(jīng)常包含的冗余。視頻序列前后幀之間存在著較大的相關(guān)性。同樣有研究證明活動(dòng)圖像相鄰幀同一位置上前后樣值的相關(guān)性也達(dá)到90%以上。 視覺冗余:人類的視覺系統(tǒng)對(duì)圖像的敏感性是非均勻的和非線性的。人的視覺系統(tǒng)(HVS)對(duì)于某些失真并不敏感。然而,在記錄的原始圖像數(shù)據(jù)時(shí),通常假設(shè)這個(gè)系統(tǒng)是均勻的和線性的,對(duì)視覺敏感和不
38、敏感的部分同等對(duì)待,從而產(chǎn)生了比理想編碼更多的數(shù)據(jù),這就是視覺冗余。 視頻信號(hào)都是由一系列單獨(dú)的圖像幀組成。每一幀都可以利用圖像編解碼器(JPEG)進(jìn)行幀內(nèi)編碼(Intra-frame Coding),每一幀在內(nèi)部先進(jìn)行編碼而沒有考慮到其它的幀。消除視頻序列中的時(shí)間冗余(連續(xù)視頻幀中的相似性),可以達(dá)到更好的壓縮效果。具體可以通過給圖像編解碼器增加一個(gè)“前后幀”來實(shí)現(xiàn),主要有以下的兩個(gè)功能: (1)預(yù)測(cè):從一個(gè)或多個(gè)先前傳輸?shù)膸瑏斫?duì)當(dāng)前幀的預(yù)測(cè); (2)補(bǔ)償:從當(dāng)前幀中減去預(yù)測(cè)幀來產(chǎn)生“殘差幀”。 接著用圖像編解碼器來處理這個(gè)殘差幀。經(jīng)過這個(gè)處理,殘差幀將包含很少的數(shù)據(jù),因而可以用
39、圖像解碼器對(duì)它進(jìn)行有效的壓縮。為了解碼幀,解碼器必須進(jìn)行逆反補(bǔ)償過程,把預(yù)測(cè)加到解碼的殘差幀中,這就是幀間編碼(Inter-frame Coding)。 視頻編碼標(biāo)準(zhǔn)的最重要的發(fā)展都是源于兩大標(biāo)準(zhǔn)組織:ITU(前身是CCITT)和ISO。 1986年,ISO和CCITT聯(lián)合成立了“聯(lián)合圖片專家組(JPEG Joint Photographic Experts Group)”,于1991年3月提交了用于灰度等級(jí)和顏色兩方面連續(xù)變化靜止圖像編碼的JPEG建議草案,于1992年7月通過證實(shí)標(biāo)準(zhǔn)。 1988年,MPEG(Moving Picture Expert Group)運(yùn)動(dòng)圖像專家組成立
40、,它致力于運(yùn)動(dòng)圖像及其伴音編碼標(biāo)準(zhǔn)化的工作,包括MPEG系統(tǒng),即MPEG視頻和MPEG音頻。原先共有三個(gè)版本MPEG-1,MPEG-2,MPEG-3,后來又增加了MPEG-4,MPEG-7等,不同的版本對(duì)應(yīng)了不同的應(yīng)用場(chǎng)合及相關(guān)的視頻質(zhì)量,對(duì)多媒體通信的發(fā)展起到了巨大的影響。[2] (1)MPEG-1 MPEG-1制定于1993年,是針對(duì)1.5Mbps以下數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒質(zhì)運(yùn)動(dòng)圖像及其伴音編碼的國(guó)際標(biāo)準(zhǔn)。MPEG-1用于在CD-ROM上存儲(chǔ)同步和彩色運(yùn)動(dòng)視頻信號(hào),可優(yōu)化為中等分辨率,并在這個(gè)優(yōu)化模式下,采用標(biāo)準(zhǔn)交換格式(SIF)。它可針對(duì)SIF標(biāo)準(zhǔn)分辨率(對(duì)于NTSC制為352240
41、;對(duì)于PAL制為352288)的圖像進(jìn)行壓縮,傳輸速率為1.5Mbits/sec,每秒播放30幀。MPEG-1對(duì)色差分量采用4:1:1的二次采樣率。MPEG-1旨在達(dá)到VRC質(zhì)量,其視頻壓縮率為26:1。 (2)MPEG-2 MPEG-2制定于1995年,它追求的是CCIR 601建議的圖像質(zhì)量DVB,HDTV和DVD等制定的3Mbps~10Mbps的運(yùn)動(dòng)圖像及其伴音的編碼標(biāo)準(zhǔn)。MPEG-2在NTSC制式下的分辨率可達(dá)720486,MPEG-2能夠提供廣播級(jí)的視像和CD級(jí)的音質(zhì)。由于MPEG-2在設(shè)計(jì)時(shí)的巧妙處理,使得大多數(shù)MPEG-2解碼器可播放MPEG-1格式的數(shù)據(jù)。正因?yàn)镸PEG-2
42、的出色性能表現(xiàn),已能適用于HDTV。除了做為DVD的指定標(biāo)準(zhǔn)外,MPEG-2還可用于為廣播、有線電視網(wǎng)、電纜網(wǎng)絡(luò)以及衛(wèi)星直播提供廣播級(jí)的數(shù)字視頻。還可提供一個(gè)較廣的范圍改變壓縮比,以適應(yīng)不同畫面質(zhì)量、存儲(chǔ)容量以及帶寬的要求。對(duì)于最終用戶來說,由于現(xiàn)存電視機(jī)分辨率的限制,MPEG-2所帶來的高清晰度畫面質(zhì)量(如DVD畫面)在電視上效果并不明顯,反而其音頻特性(如加重低音,多伴音聲道等)更引人注目。 (3)MPEG-3 MPEG-3是ISO/IEC最初為HDTV開發(fā)的編碼壓縮標(biāo)準(zhǔn)。但由于MPEG-2的高速發(fā)展,MPEG-3的功能已被淘汰,其原來的工作由MPEG-2小組承擔(dān)。 (4)MPEG-
43、4 MPEG-4于1998年11月公布,該標(biāo)準(zhǔn)提出了基于對(duì)象編碼的概念,不僅針對(duì)一定比特率下的視頻編碼、音頻編碼,更加注重于多媒體系統(tǒng)的交互性和靈活性。MPEG-4標(biāo)準(zhǔn)主要應(yīng)用于視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低,在4800-64000bits/sec之間,分辨率為176144。MPEG-4利用很窄的帶寬,通過幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以最少的數(shù)據(jù)能取得最佳的圖像質(zhì)量。MPEG-4是第一個(gè)讓用戶由被動(dòng)變?yōu)橹鲃?dòng)的動(dòng)態(tài)圖像標(biāo)準(zhǔn),從根源上說,MPEG-4將自然物體與人造物體相溶合(視覺效果意
44、義上的),其試圖達(dá)到兩個(gè)目標(biāo):低比特率下的多媒體通信及多工業(yè)的多媒體通信的綜合。據(jù)此目標(biāo),MPEG-4引入了AV對(duì)象(Audio/Visual Objects),從而使得更多的交互操作成為可能。 MPEG-4的應(yīng)用前景可以說非常廣闊。它的出現(xiàn)能推動(dòng)以下的幾個(gè)方面:數(shù)字電視、動(dòng)態(tài)圖像、萬維網(wǎng)(WWW)、實(shí)時(shí)多媒體監(jiān)控、低比特率下的移動(dòng)多媒體通信、Internet/Intranet上的視頻流與可視游戲、基于面部表情模擬的虛擬會(huì)議、DVD上的交互多媒體應(yīng)用、基于計(jì)算機(jī)網(wǎng)絡(luò)的可視化合作實(shí)驗(yàn)室場(chǎng)景應(yīng)用等。 MPEG-4技術(shù)還在不斷的完善和發(fā)展當(dāng)中,新的MPEG-4標(biāo)準(zhǔn)的應(yīng)用正在促進(jìn)多媒體壓縮技術(shù)經(jīng)歷
45、另一次重大變化。這一變化會(huì)與1990年MPEG-2壓縮標(biāo)準(zhǔn)的推出一樣巨大,而且隨著視頻通信應(yīng)用的快速發(fā)展,MPEG-4標(biāo)準(zhǔn)勢(shì)會(huì)影響到范圍廣泛的多種應(yīng)用領(lǐng)域。 (5)MPEG-7 繼MPEG-4之后,要解決的矛盾就是對(duì)日漸龐大的圖像、聲音信息的管理和迅速搜索。針對(duì)這個(gè)矛盾,MPEG提出了這個(gè)解決方案MPEG-7。MPEG-7力求能夠快速并且有效地搜索出用戶所需的不同類型的多媒體信息。該標(biāo)準(zhǔn)沒有規(guī)定利用描述進(jìn)行搜索的工具或任何程序。 目前MPEG系列國(guó)際標(biāo)準(zhǔn)已經(jīng)成為影響最大的多媒體技術(shù)標(biāo)準(zhǔn),對(duì)數(shù)字電視、視聽消費(fèi)電子產(chǎn)品、多媒體通信等產(chǎn)業(yè)產(chǎn)生了深遠(yuǎn)影響。 ITU主要精力則集中在支持實(shí)時(shí)、雙向
46、視頻通信上。而負(fù)責(zé)發(fā)展這些標(biāo)準(zhǔn)的組織就是眾所周知的VCEG(視頻編碼專家組),其主要標(biāo)準(zhǔn)有: (1) H.261視頻編碼標(biāo)準(zhǔn) H.261是ITU-T為在綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)上開展雙向聲像業(yè)務(wù)而制定的,速率為64kb/s的整數(shù)倍。H.261只對(duì)CIF和QCIF兩種圖像格式進(jìn)行處理,每幀圖像被分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來處理。H.261是最早的運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn),包括運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)、DCT變換、量化、熵編碼,以及與固定速率的信道相適配的速率控制等部分。 (2) H.263視頻壓縮標(biāo)準(zhǔn) H.263是ITU-T為低于64kb/s的窄帶通信信道而制
47、定的視頻編碼標(biāo)準(zhǔn)。它的標(biāo)準(zhǔn)輸入圖像格式可以是S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亞取樣圖像。H.263與H.261相比采用了半象素的運(yùn)動(dòng)補(bǔ)償,且增加了4種有效的壓縮編碼模式。 先進(jìn)的預(yù)測(cè)模式允許一個(gè)宏塊中4個(gè)88亮度塊各對(duì)應(yīng)一個(gè)運(yùn)動(dòng)矢量,提高了預(yù)測(cè)精度;兩個(gè)色度塊的運(yùn)動(dòng)矢量取這4個(gè)亮度塊運(yùn)動(dòng)矢量的平均值。補(bǔ)償時(shí),88亮度塊每個(gè)象素的補(bǔ)償值由3個(gè)預(yù)測(cè)值加權(quán)平均而得到。使用這個(gè)模式可以產(chǎn)生顯著的編碼增益,特別是采用重疊的塊運(yùn)動(dòng)補(bǔ)償后,能減少塊效應(yīng),提高主觀質(zhì)量。 (3) H.264視頻壓縮標(biāo)準(zhǔn) H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT
48、)制定的新一代視頻壓縮編碼標(biāo)準(zhǔn)。它的主要優(yōu)點(diǎn)列出如下:在相同重建圖像質(zhì)量下,H.264比H.263+和MPEG-4(SP)減小50%的碼率。既可工作于低時(shí)延的模式以滿足實(shí)時(shí)業(yè)務(wù),如會(huì)議電視;又可工作于無時(shí)延限制的場(chǎng)合,如視頻存儲(chǔ)。在編/解碼器中采用復(fù)雜度可分級(jí)設(shè)計(jì),在圖像質(zhì)量和編碼處理之間可分級(jí),以適應(yīng)不同復(fù)雜度的場(chǎng)合。 相對(duì)于早期的視頻壓縮標(biāo)準(zhǔn),H.264引入了許多相對(duì)先進(jìn)的技術(shù),包括44的整數(shù)變換、空域內(nèi)的幀內(nèi)預(yù)測(cè)、1/4象素精度的運(yùn)動(dòng)估計(jì)、多參考幀與多種大小塊的幀間預(yù)測(cè)技術(shù)等。新技術(shù)帶來了較高的壓縮比,同時(shí)大大的提高了算法的復(fù)雜度。 視頻編碼通過去除圖像的空間與時(shí)間相關(guān)性來達(dá)到數(shù)據(jù)壓
49、縮的目的。空間相關(guān)性可以通過有效的變換來去除,如DCT變換、H.264的整數(shù)變換;時(shí)間相關(guān)性則通過幀間預(yù)測(cè)來去除。這里所說的變換去除空間相關(guān)性,僅僅局限在所變換的塊內(nèi),如88或者44,并沒有塊與塊之間的處理。H.263+與MPEG-4則引入了幀內(nèi)預(yù)測(cè)技術(shù),在變換域中根據(jù)相鄰塊對(duì)當(dāng)前塊的某些系數(shù)做預(yù)測(cè)。H.264則是在空域中,利用當(dāng)前塊的相鄰象素直接對(duì)每個(gè)系數(shù)做預(yù)測(cè),有效地去除相鄰之間的相關(guān)性,極大地提高了幀內(nèi)編碼的效率。 1.2 運(yùn)動(dòng)估計(jì)的研究現(xiàn)狀 運(yùn)動(dòng)估計(jì)算法通常分為兩大類:一類是象素遞歸算法PRA(Pixel Recursive Algorithm);另一類是塊匹配算法BMA(Blo
50、ck Matching Algorithm)。PRA是基于遞歸思想,如果連續(xù)幀中象素?cái)?shù)據(jù)的變化是因?yàn)槲矬w的移位引起的,算法就會(huì)沿著梯度方向?qū)δ硞€(gè)象素周圍的若干象素做迭代運(yùn)算,使連續(xù)的運(yùn)算最后收斂于一個(gè)固定的運(yùn)動(dòng)估計(jì)矢量,從而預(yù)測(cè)該象素的位移;而BMA則是基于當(dāng)前幀中一定大小的塊,在當(dāng)前幀的前后幀的一定區(qū)域內(nèi)搜索該象素塊的最佳匹配塊,作為它的預(yù)測(cè)塊。盡管PRA對(duì)比較復(fù)雜的運(yùn)動(dòng)形式來說,其預(yù)測(cè)精度要高于BMA,但是由于其計(jì)算量比BMA大的多,同時(shí)BMA本身也擁有較好的性能,因此目前的視頻壓縮編碼國(guó)際標(biāo)準(zhǔn)普遍都采用BMA。 本文的研究都是針對(duì)塊匹配的運(yùn)動(dòng)估計(jì)算法,在后文中,如無特別說明,所提到的運(yùn)
51、動(dòng)估計(jì)也都是指基于塊匹配的運(yùn)動(dòng)估計(jì)。 在基于塊匹配的運(yùn)動(dòng)估計(jì)中,最直接的是全搜索算法(Full Search,F(xiàn)S),它能夠得到全局最優(yōu)的運(yùn)動(dòng)矢量,但該算法的運(yùn)算量也相當(dāng)巨大,成為了編碼器實(shí)時(shí)應(yīng)用的瓶頸。為了提高運(yùn)動(dòng)估計(jì)的運(yùn)算速度,人們不斷提出針對(duì)塊匹配運(yùn)動(dòng)估計(jì)的改進(jìn)快速算法,其目標(biāo)是在保證編碼質(zhì)量的同時(shí),盡可能的降低運(yùn)算復(fù)雜度。 快速搜索模板這類算法的主要想法是通過在搜索窗口內(nèi)按照固定的搜索模板和步驟,對(duì)較少的幾個(gè)點(diǎn)進(jìn)行匹配運(yùn)算來降低運(yùn)算復(fù)雜度,這類快速模板算法都是基于一個(gè)共同的假設(shè),即在搜索窗內(nèi)有且僅有一個(gè)全局匹配誤差最小點(diǎn),而且匹配誤差隨著當(dāng)前點(diǎn)與全局最優(yōu)點(diǎn)之間距離的增大而增大。模板
52、搜索快速算法是提出最早,發(fā)展最為成熟,也是應(yīng)用最為廣泛的一類快速算法。它的優(yōu)點(diǎn)是算法簡(jiǎn)單,計(jì)算量小,加速比較大,缺點(diǎn)是容易陷入局部最優(yōu)值,尤其在大運(yùn)動(dòng)情況下,搜索的準(zhǔn)確度難以保證。 該類算法的經(jīng)典代表有三步法[3](Three step seareh,TSS)、2維對(duì)數(shù)法[4] (2-Dime nsion Logarithm,2D-LOG)、新三步法[5](New Three step seareh,NTSS)、四步法[6](Four Step Seareh,F(xiàn)SS)、菱形法[7](Diamond Seareh,DS)、六邊形搜索法[8](Hexagon- Based seareh,HEXB
53、S)等。 1.3 本文主要內(nèi)容和工作安排 本論文的主要工作就是在基于塊匹配的視頻圖像運(yùn)動(dòng)估計(jì)技術(shù)研究的基礎(chǔ)上,深入分析、全面總結(jié)現(xiàn)有的經(jīng)典塊匹配運(yùn)動(dòng)估計(jì)算法,并通過仿真實(shí)驗(yàn)比較他們的性能。在此基礎(chǔ)上,力爭(zhēng)提出一種優(yōu)化和改進(jìn)后的塊匹配運(yùn)動(dòng)估計(jì)算法,使其能夠在保證圖像質(zhì)量的同時(shí),搜索速度得到較大的提高。 本論文章節(jié)安排如下: 第1章 緒論。通過查閱大量的相關(guān)文獻(xiàn),介紹了課題的背景與研究的重要意義,然后對(duì)視頻壓縮技術(shù)也進(jìn)行了簡(jiǎn)要介紹,最后介紹了運(yùn)動(dòng)估計(jì)的研究現(xiàn)狀。 第2章 運(yùn)動(dòng)估計(jì)概述及其技術(shù)指標(biāo)。介紹了運(yùn)動(dòng)估計(jì)的思想,著重分析了塊匹配運(yùn)動(dòng)估計(jì)的原理,對(duì)塊匹配運(yùn)動(dòng)估計(jì)的幾項(xiàng)重要的技術(shù)指標(biāo)(
54、分塊的大小,匹配準(zhǔn)則,搜索范圍,估計(jì)精度)的確定進(jìn)行了重點(diǎn)討論。 第3章 典型塊匹配運(yùn)動(dòng)估計(jì)算法分析。詳細(xì)闡述了各種經(jīng)典塊匹配運(yùn)動(dòng)估計(jì)算法,并從搜索算法在搜索速度、計(jì)算量、匹配質(zhì)量、等方面的性能進(jìn)行了分析比較。最后通過仿真、實(shí)驗(yàn)數(shù)據(jù)定量地評(píng)價(jià)了各算法的優(yōu)缺點(diǎn)。 總結(jié)與展望??偨Y(jié)了全文的研究成果,并對(duì)運(yùn)動(dòng)估計(jì)算法研究進(jìn)行了展望,提出了進(jìn)一步的研究工作。 第2章 運(yùn)動(dòng)估計(jì)概述及其技術(shù)指標(biāo) 由于視頻序列圖像在時(shí)間上具有較強(qiáng)的相關(guān)性,運(yùn)動(dòng)估計(jì)(ME)及運(yùn)動(dòng)補(bǔ)償(MC)技術(shù)可以有效的減少時(shí)間相關(guān)性,因此該技術(shù)被廣泛應(yīng)用于各種視頻壓縮編碼方案中。運(yùn)動(dòng)估計(jì)用來估計(jì)物體的位移,得到運(yùn)動(dòng)矢量;運(yùn)動(dòng)補(bǔ)償根
55、據(jù)得到的運(yùn)動(dòng)矢量,對(duì)前一幀中由于運(yùn)動(dòng)而產(chǎn)生的位移進(jìn)行調(diào)整,從而得到盡可能接近本幀的預(yù)測(cè)幀。由此可見,運(yùn)動(dòng)估計(jì)算法越完善,估計(jì)出的運(yùn)動(dòng)矢量越準(zhǔn)確,運(yùn)動(dòng)補(bǔ)償?shù)男阅芫驮胶?,從而使預(yù)測(cè)誤差越小,編碼后需要傳輸?shù)男畔⒘恳矊㈦S之大大減少,整個(gè)系統(tǒng)的碼率壓縮比就會(huì)得到很大的提高,因此運(yùn)動(dòng)估計(jì)和補(bǔ)償技術(shù)己經(jīng)成為視頻序列圖像編碼系統(tǒng)中減少時(shí)間冗余、提高壓縮比的重要技術(shù)。H.26x和MPEG-1,MPEG-2,MPEG-4等標(biāo)準(zhǔn)采用的都是基于塊匹配運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償?shù)膸g壓縮方案,其壓縮比和基于幀內(nèi)壓縮的標(biāo)準(zhǔn)(如JPEG)相比有較大的提高。 典型的視頻壓縮編解碼系統(tǒng)如圖2-1所示,運(yùn)動(dòng)估計(jì)算法實(shí)現(xiàn)幀間編解碼的基
56、本過程是這樣的:在編碼端,如圖2-1(a)所示當(dāng)前幀與幀存器里的參考幀先進(jìn)行運(yùn)動(dòng)估計(jì),得到當(dāng)前幀的運(yùn)動(dòng)矢量,運(yùn)動(dòng)矢量與參考幀又補(bǔ)償出當(dāng)前幀的預(yù)測(cè)幀,預(yù)測(cè)幀與當(dāng)前幀相減得到預(yù)測(cè)誤差,然后對(duì)預(yù)測(cè)誤差進(jìn)行DCT變換和量化,最后,把運(yùn)動(dòng)矢量和量化后的DCT信息一起進(jìn)行變長(zhǎng)編碼,同時(shí),量化后的DCT信息又經(jīng)過反量化、IDCT變換得到預(yù)測(cè)誤差,預(yù)測(cè)誤差與先前的預(yù)測(cè)幀相加得到當(dāng)前幀,存入幀存器作為下一幀的參考幀。 (a)編碼器 (b)解碼器 圖2-1 典型的視頻壓縮編解碼系統(tǒng) 在解碼端,如圖2-1(b)所示,壓縮碼流經(jīng)過變長(zhǎng)解碼分成兩部分:運(yùn)動(dòng)矢量和預(yù)測(cè)誤差的逆信息,然后將預(yù)測(cè)誤差的逆信息經(jīng)
57、過反量化、IDCT變換得到預(yù)測(cè)誤差,將運(yùn)動(dòng)矢量與幀存器里的前一幀進(jìn)行運(yùn)動(dòng)補(bǔ)償?shù)玫筋A(yù)測(cè)幀,再將預(yù)測(cè)幀與預(yù)測(cè)誤差相加就得到了當(dāng)前幀的重構(gòu)圖像,同時(shí)保存到幀存器里作為下一幀的參考幀。 在視頻壓縮編碼中,即使采用快速算法,運(yùn)動(dòng)估計(jì)仍是最費(fèi)時(shí)的環(huán)節(jié),如在H.261的編碼過程中,在采用著名的三步快速搜索法的情況下,運(yùn)動(dòng)估計(jì)仍要占用整個(gè)編碼過程的63%的計(jì)算量;而在H.263編碼器中,運(yùn)動(dòng)估計(jì)占用了42%的計(jì)算量。因此,運(yùn)動(dòng)估計(jì)是視頻壓縮的瓶頸。 基于上述原因,高效快速的運(yùn)動(dòng)估計(jì)算法一直是視頻壓縮領(lǐng)域的研究熱點(diǎn)。尤其是從1997年10月召開的MPEG會(huì)議上開始征集運(yùn)動(dòng)估計(jì)快速算法以來,在視頻編碼中的運(yùn)動(dòng)
58、估計(jì)算法的研究領(lǐng)域中競(jìng)爭(zhēng)日益激烈。 2.1 運(yùn)動(dòng)估計(jì) 對(duì)于視頻序列圖像,由于相鄰幀間存在很大的時(shí)間相關(guān)性,即時(shí)間兀余(Temp- oral Redundancy)。所以減少時(shí)間冗余,可以大幅度提高視頻壓縮編碼的效率。這方面一種有效的方法就是基于塊匹配的運(yùn)動(dòng)估計(jì)(Motion Estimation,ME),因?yàn)樗惴ê?jiǎn)單,便于實(shí)現(xiàn)等優(yōu)點(diǎn)而得到廣泛的應(yīng)用。其基本思想是將圖像序列的每一幀分成M*N的宏塊,然后對(duì)于當(dāng)前幀中的每一塊根據(jù)一定的匹配準(zhǔn)則在前一幀或后一幀中在給定的搜索范圍內(nèi)找出與當(dāng)前塊最相似的塊,即匹配塊,根據(jù)匹配塊與當(dāng)前塊的相對(duì)位置計(jì)算出運(yùn)動(dòng)位移,所得運(yùn)動(dòng)位移既為當(dāng)前塊的運(yùn)動(dòng)矢量。運(yùn)
59、動(dòng)估計(jì)的越準(zhǔn)確,補(bǔ)償?shù)臍埐罹驮叫。幋a效率就越高,解碼出來的圖像質(zhì)量就越好。 運(yùn)動(dòng)估計(jì)用于幀間編碼方式時(shí),通過參考幀圖像產(chǎn)生對(duì)被壓縮圖像的估計(jì)。運(yùn)動(dòng)估計(jì)是以宏塊為單位進(jìn)行,計(jì)算被壓縮圖像與參考圖像的對(duì)應(yīng)位置上的宏塊間的位置偏移。這種位置偏移是以運(yùn)動(dòng)矢量來描述的,一個(gè)運(yùn)動(dòng)矢量代表水平和垂直兩個(gè)方向上的位移。 圖2-2 宏塊、搜索區(qū)域與運(yùn)動(dòng)矢量的關(guān)系 運(yùn)動(dòng)估計(jì)及補(bǔ)償?shù)幕驹砭褪抢脦g運(yùn)動(dòng)估計(jì)得到待編碼塊的一個(gè)參考?jí)K,然后用這個(gè)參考?jí)K進(jìn)行運(yùn)動(dòng)補(bǔ)償,將補(bǔ)償后的殘差進(jìn)行DCT變換和可變長(zhǎng)編碼。運(yùn)動(dòng)估計(jì)的主要過程如圖2-2所示。這樣運(yùn)動(dòng)補(bǔ)償方法是基于局部運(yùn)動(dòng)估計(jì)的,它對(duì)圖像中的宏塊進(jìn)行操作,
60、在參考幀圖像的搜索范圍內(nèi),搜索與當(dāng)前幀最接近的宏塊,從而得到這個(gè)宏塊的運(yùn)動(dòng)矢量。運(yùn)動(dòng)矢量是一個(gè)包括水平和垂直分量的二維矢量,編碼過程只對(duì)這個(gè)運(yùn)動(dòng)矢量和當(dāng)前宏塊與在參考幀中搜索到的宏塊的差值就行編碼。運(yùn)動(dòng)估計(jì)越準(zhǔn)確,那么所要編碼的殘差圖像就越小,運(yùn)動(dòng)補(bǔ)償編碼所需要的位數(shù)就越少。另外,如果運(yùn)動(dòng)估計(jì)的搜索采用全搜索法,它占用了編碼過程中程序運(yùn)行的大部分時(shí)間,所以為了提高搜索速度和效率,搜索策略也很重要。目前研究最多的快速搜索算法,有三步法、四步法、新三步法、菱形法等,這些算法將在第三章詳細(xì)介紹。 2.2 塊匹配運(yùn)動(dòng)估計(jì)的基本原理 運(yùn)動(dòng)估計(jì)可以看作是對(duì)相鄰圖像幀時(shí)域相關(guān)性的檢測(cè),通過對(duì)相鄰圖像幀之
61、間相似部分的搜尋來獲得圖像中景物對(duì)象的運(yùn)動(dòng)信息。運(yùn)動(dòng)估計(jì)和補(bǔ)償?shù)幕具^程是通過一定的方法在參考幀圖像中搜索當(dāng)前幀圖像的運(yùn)動(dòng)信息,再根據(jù)這些運(yùn)動(dòng)信息在參考圖像上進(jìn)行相應(yīng)的運(yùn)動(dòng)補(bǔ)償操作,得到一個(gè)當(dāng)前幀的重構(gòu)圖像。由于運(yùn)動(dòng)估計(jì)時(shí)得到了當(dāng)前圖像與參考圖像的相關(guān)信息,這個(gè)重構(gòu)圖像與當(dāng)前圖像的差值往往比直接用參考圖像和當(dāng)前圖像作差而得到的比特?cái)?shù)要少得多,因此,運(yùn)動(dòng)估計(jì)與補(bǔ)償技術(shù)能有效減少相鄰幀之間的數(shù)據(jù)冗余,從而獲得更高的壓縮比,降低視頻壓縮編碼后的碼率。 運(yùn)動(dòng)估計(jì)的一個(gè)基本問題是如何選擇運(yùn)動(dòng)信息的表示方式,這又與運(yùn)動(dòng)估計(jì)的算法模型密切相關(guān)。最直接的方法是對(duì)于每一個(gè)當(dāng)前幀的像素都采用一個(gè)二維矢量(由于我
62、們這里討論的都是針對(duì)二維圖像的運(yùn)動(dòng)估計(jì),因此每個(gè)被估計(jì)的圖像單元的運(yùn)動(dòng)信息都可以表示為一個(gè)由水平方向分量和垂直方向分量構(gòu)成的二維矢量)來表示其運(yùn)動(dòng)信息,即我們通常所稱的運(yùn)動(dòng)矢量。這種方法具有普遍的適用性,但是由于視頻圖像通常具有非常多的像素,這樣對(duì)每一個(gè)像素都進(jìn)行運(yùn)動(dòng)估計(jì)是不現(xiàn)實(shí)的,同時(shí)這樣得到的運(yùn)動(dòng)矢量場(chǎng)的數(shù)據(jù)量太大而使得總的編碼比特反而不能減少。因此,在實(shí)際中,我們一般將圖像幀分割為許多互不重疊的宏塊,并假定宏塊中的所有像素做相同的平動(dòng),這樣就可以分別對(duì)每個(gè)宏塊獨(dú)立地估計(jì)其運(yùn)動(dòng)信息參數(shù)即運(yùn)動(dòng)矢量,這就是目前在各種主流的視頻壓縮標(biāo)準(zhǔn)(如MPEG-4、H.264等)中被廣泛應(yīng)用的基于塊匹配的運(yùn)
63、動(dòng)估計(jì)方法。這種方法在運(yùn)動(dòng)估計(jì)精度與計(jì)算復(fù)雜度之間提供了一個(gè)較好的折衷,其基本原理如圖2-3所示。 在對(duì)某一幀圖像進(jìn)行運(yùn)動(dòng)估計(jì)時(shí),首先將其按照一定的方式劃分成互不重疊的若干個(gè)宏塊,設(shè)宏塊的大小為M*N(H.263、MPEG-2和MPEG-4建議采用M=N=16,而H.264則可采用幾種不同大小的宏塊模式進(jìn)行估計(jì)),然后再對(duì)每幀中的宏塊依次進(jìn)行運(yùn)動(dòng)估計(jì),獲得各自的運(yùn)動(dòng)矢量。在基于塊匹配運(yùn)動(dòng)估計(jì)和補(bǔ)償?shù)囊曨l壓縮編碼系統(tǒng)中,宏塊是進(jìn)行DCT變換、量化、運(yùn)動(dòng)估計(jì)、運(yùn)動(dòng)補(bǔ)償及圖像重建等操作的基本單元,即在運(yùn)動(dòng)預(yù)測(cè)編解碼過程中均以宏塊作為操作的單位。 圖2-3 塊匹配運(yùn)動(dòng)估計(jì)原理示意圖 為了便于
64、說明塊匹配算法的基本原理,設(shè)當(dāng)前幀中的某目標(biāo)宏塊左上角像素點(diǎn)的坐標(biāo)為:s=(x,y)。需要說明的是,由于假設(shè)宏塊中的所有像素都作相同的平移運(yùn)動(dòng),因此宏塊中的任意一點(diǎn)都可以標(biāo)明其位置。然后,在參考幀中,以待估計(jì)宏塊的位置坐標(biāo)s為中心,在水平方向分別向左和向右擴(kuò)展一定長(zhǎng)度的搜索距離,而在垂直方向分別向上和向下擴(kuò)展,則可得到一個(gè)大小為的搜索窗砰。搜索窗中的每一個(gè)點(diǎn)都對(duì)應(yīng)著一個(gè)候選匹配宏塊,設(shè)某個(gè)候選宏塊的左上角像素點(diǎn)的坐標(biāo)為,則該候選宏塊相對(duì)于目標(biāo)宏塊的偏移量mv就是該搜索點(diǎn)對(duì)應(yīng)的運(yùn)動(dòng)矢量,即: (2-1) 塊匹配運(yùn)動(dòng)估計(jì)的目的是在搜索窗中搜尋與目標(biāo)宏塊最為匹配的候選宏
65、塊,并獲得相應(yīng)的運(yùn)動(dòng)矢量。其中,搜索窗的大小由視頻中景物對(duì)象的運(yùn)動(dòng)速度決定。對(duì)象的運(yùn)動(dòng)速度越塊,搜索窗也應(yīng)越大,即和的取值需加大,以覆蓋更大的運(yùn)動(dòng)范圍,從而獲得更高的預(yù)測(cè)精度。不過,較大的搜索窗通常會(huì)使得搜索點(diǎn)增多,從而加大計(jì)算量,因此,搜索距離的設(shè)定需綜合考慮具體視頻的運(yùn)動(dòng)特性、運(yùn)動(dòng)估計(jì)的質(zhì)量以及算法的計(jì)算量等因素,以獲得最佳的估計(jì)性能。 2.3 塊匹配的運(yùn)動(dòng)估計(jì)的參數(shù)和指標(biāo) 基于塊匹配的運(yùn)動(dòng)估計(jì)算法,在具體實(shí)現(xiàn)的時(shí)候,需要考慮其中的幾個(gè)參數(shù):分塊大小(M,N取值),匹配準(zhǔn)則,搜索范圍和估計(jì)精度。其中每一個(gè)都對(duì)匹配的效率產(chǎn)生重要影響,有些則是最關(guān)鍵的。 2.3.1 分塊大小 上面已經(jīng)
66、提到過一點(diǎn),塊匹配法有個(gè)前提,就是同一個(gè)塊內(nèi)的像素運(yùn)動(dòng)方向是一致的。因此需要選擇合適的塊大小。塊大小大時(shí),塊內(nèi)各像素作平移運(yùn)動(dòng)的可能性比較小,不滿足我們的前提條件,會(huì)影響估計(jì)的精度;塊大小小時(shí),會(huì)受噪聲影響,結(jié)果不準(zhǔn)確,而且還會(huì)導(dǎo)致產(chǎn)生許多運(yùn)動(dòng)矢量,使得運(yùn)算量增加,降低了編碼的效率。所以塊的大小必須選擇合適,滿足上面的要求。當(dāng)前的視頻壓縮標(biāo)準(zhǔn),如H.26x和MPEG一般以1616大小的塊作為一個(gè)宏塊,這是一個(gè)已經(jīng)證明的較好的平衡結(jié)果。而且H.263和MPEG-4在進(jìn)行1616的宏塊運(yùn)動(dòng)估計(jì)的基礎(chǔ)上,還加入了88塊的處理,使得預(yù)測(cè)的精度有了提高。H.264更是最小分塊達(dá)到了44,進(jìn)一步使得運(yùn)動(dòng)估計(jì)的結(jié)果精確。 2.3.2 匹配準(zhǔn)則 塊匹配準(zhǔn)則是判斷塊相似程度的算法和標(biāo)準(zhǔn),準(zhǔn)則的好壞直接影響了運(yùn)動(dòng)估計(jì)的結(jié)果。而且匹配運(yùn)算、數(shù)據(jù)讀取復(fù)雜度很大程度上決定于所采用的塊匹配準(zhǔn)則。在塊匹配法中,有三種最優(yōu)匹配準(zhǔn)則: (1)最小絕對(duì)差MAD(Mean Absolute Difference)、 (2-2) MAD值最小時(shí)為最優(yōu)的匹配點(diǎn)。 (2)最小均方
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 110中國(guó)人民警察節(jié)(筑牢忠誠警魂感受別樣警彩)
- 2025正字當(dāng)頭廉字入心爭(zhēng)當(dāng)公安隊(duì)伍鐵軍
- XX國(guó)企干部警示教育片觀后感筑牢信仰之基堅(jiān)守廉潔底線
- 2025做擔(dān)當(dāng)時(shí)代大任的中國(guó)青年P(guān)PT青年思想教育微黨課
- 2025新年工作部署會(huì)圍繞六個(gè)干字提要求
- XX地區(qū)中小學(xué)期末考試經(jīng)驗(yàn)總結(jié)(認(rèn)真復(fù)習(xí)輕松應(yīng)考)
- 支部書記上黨課筑牢清廉信念為高質(zhì)量發(fā)展?fàn)I造風(fēng)清氣正的環(huán)境
- 冬季消防安全知識(shí)培訓(xùn)冬季用電防火安全
- 2025加強(qiáng)政治引領(lǐng)(政治引領(lǐng)是現(xiàn)代政黨的重要功能)
- 主播直播培訓(xùn)直播技巧與方法
- 2025六廉六進(jìn)持續(xù)涵養(yǎng)良好政治生態(tài)
- 員工職業(yè)生涯規(guī)劃方案制定個(gè)人職業(yè)生涯規(guī)劃
- 2024年XX地區(qū)黨建引領(lǐng)鄉(xiāng)村振興工作總結(jié)
- XX中小學(xué)期末考試經(jīng)驗(yàn)總結(jié)(認(rèn)真復(fù)習(xí)輕松應(yīng)考)
- 幼兒園期末家長(zhǎng)會(huì)長(zhǎng)長(zhǎng)的路慢慢地走