《基于JPEG雙量化效應的圖像盲取證》由會員分享,可在線閱讀,更多相關《基于JPEG雙量化效應的圖像盲取證(4頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、基于JPEG雙量化效應的圖像盲取證
摘要:JPEG圖像的雙量化效應為JPEG圖像的篡改檢測提供了重要線索。根據(jù)JPEG圖像被局部篡改后,又被保存為JPEG格式時,未被篡改的區(qū)域(背景區(qū)域)的離散余弦變換(DCT)系數(shù)會經(jīng)歷雙重JPEG壓縮,篡改區(qū)域的DCT系數(shù)則只經(jīng)歷了1次JPEG壓縮。而JPEG圖像在經(jīng)過離散余弦變換后其DCT域的交流(AC)系數(shù)的分布符合一個用合適的參數(shù)來描述的拉普拉斯分布,在此基礎上提出了一種JPEG圖像重壓縮概率模型來描述重壓縮前后DCT系數(shù)統(tǒng)計特性的變化,并依據(jù)貝葉斯準則,利用后驗概率表示出圖像篡改中存在的雙重壓縮效應塊
2、和只經(jīng)歷單次壓縮塊的特征值。然后設定閾值,通過閾值進行分類判斷就可以實現(xiàn)對篡改區(qū)域的自動檢測和提取。實驗結果表明,該方法能快速并準確地實現(xiàn)篡改區(qū)域的自動檢測和提取,并且在第2次壓縮因子小于第1次壓縮因子時,檢測結果相對于利用JPEG塊效應不一致的圖像篡改盲檢測算法和利用JPEG圖像量化表的圖像篡改盲檢測算法有了明顯的提高。
關鍵詞:雙量化效應;圖像篡改;拉普拉斯分布;盲取證
引言
JPEG(Joint Photographic Experts Group)是當前主流的圖像壓縮標準,是目前靜態(tài)圖像中壓縮比較高的,被廣泛地應用于多媒體和網(wǎng)絡程序中,而針對此
3、類圖像的偽造篡改也是越來越多,并且僅僅依靠人眼很難辨別出真?zhèn)?。在這種情況下圖像的真實性也就成為人們所關注的問題。因此,本文對此類圖像的取證技術展開研究。當前數(shù)字圖像取證技術主要分為兩類:主動取證和被動取證。主動取證技術[1]是預先對數(shù)字圖像嵌入脆弱水印或簽名,通過提取水印、簽名的手段進行取證; 相比之下,數(shù)字圖像被動取證技術作為一種在不依賴任何預簽名提取或預嵌入信息對圖像的真?zhèn)魏蛠碓催M行鑒別的技術,只需要依靠待檢測圖像就可以實施取證,具有更高的應用價值,但其取證難度大于主動取證。針對經(jīng)歷雙重JPEG篡改圖像,研究學者已經(jīng)提出了各種盲取證算法。很多學者通過對圖像第1次壓縮量化表的估計來定位篡改區(qū)
4、域[2-4];Farid[5]則通過使用不同的壓縮因子對待測的JPEG圖像進行再次壓縮,當壓縮因子與篡改區(qū)域的壓縮因子相同時,篡改區(qū)域表現(xiàn)出的失真程度最小,由此來實現(xiàn)對圖像篡改區(qū)域的檢測。He等[6]通過分析JPEG圖像的離散余弦變換(Discrete Cosine Transform, DCT)系數(shù)的雙重量化效應,通過尋找局部二次壓縮的痕跡,首次實現(xiàn)了對JPEG圖像的篡改區(qū)域的自動檢測和定位。Binghiamton大學的Fridrich研究小組運用將針對圖像單個像素點的方法轉化為對圖像塊的操作,提出了一種基于圖像塊的DCT量化系數(shù)分析的盲取證算法[7];李晟等[8]則用一定的壓縮因子對圖像進
5、行再次壓縮,根據(jù)篡改區(qū)域的失真程度大于非篡改區(qū)域的失真程度,實現(xiàn)對JPEG圖像的篡改檢測;文獻[9]通過利用每個交流(Alternating Current, AC)系數(shù)頻率項的光譜能量密度中的峰值點個數(shù)與量化步長之間差值為1的特點,估計出量化表,進一步計算得到圖像的塊特征,通過塊特征之間的不連續(xù)性來檢測圖像是否經(jīng)過篡改。
然而,現(xiàn)有的大部分盲取證算法大都要求待檢測圖像是未壓縮或者是壓縮因子較高的圖像,并且能夠廣泛應用的JPEG圖像的篡改檢測算法還比較少。本文基于JPEG圖像壓縮理論基礎,通過對JPEG圖像雙量化效應的分析,利用其DCT域的AC系數(shù)的分布符合拉普拉斯分布,并采用局
6、部鄰域法對λ進行估計,依據(jù)貝葉斯準則,利用后驗概率表示出篡改圖像中存在的雙重壓縮效應的篡改塊,實現(xiàn)對篡改區(qū)域的自動檢測和提取。與文獻[11]所采用的算法相比,本文方法的檢測性能有很大的提升,特別是在第2次壓縮因子(QF2)比第1次壓縮因子(QF1)小時,檢測效果更好。
一、JPEG壓縮原理
JPEG壓縮和解壓過程如圖1所示,JPEG壓縮是一種有損壓縮,它是基于8×8像素塊的壓縮編碼過程,主要由預處理、分塊、離散余弦變換、量化、Huffman編碼等構成。
原始圖像數(shù)據(jù)分成8×8的小塊,經(jīng)過DCT后,其低頻分量都集中在
7、左上角,高頻分量分布在右下角,對于每一個8×8的小塊,其中D(0,0)(即第1行第1列元素,D為8×8的圖像塊)代表了直流(Direct Current, DC)系數(shù),其他的63個元素是AC系數(shù)。而低頻分量包含了圖像的主要信息(如亮度),其中量化的目的就是為了保持低頻分量,抑制高頻分量,達到壓縮圖像的目的。而DCT系數(shù)的量化這一步驟是不可逆的,量化步長越大,圖像在進行反量化時,所丟失的高頻信息也就會越多,圖像失真也就會越明顯。量化矩陣通常與一定的壓縮因子相對應, 壓縮因子是一個從1到100的整數(shù)。圖像進行JPEG壓縮時,通常需要指定一個壓縮因子QF,一旦QF確定,量化矩
8、陣QT就可以通過式(1)計算得出:
QT=[(QTij×α(QF)+50)/100]; i, j∈{0,1,2,…,7} (1
α(QF)=5000/QF,1≤QF
200-2QF,50≤QF≤100
其中:QTij是JPEG標準推薦亮度分量的量化矩陣,[]表示四舍五入運算。
二、JPEG圖像合成篡改的數(shù)學模型
JPEG合成篡改圖像是指JPEG格式的圖像的一部分被其他圖像置換,如圖2所示,圖2(a)為一幅JPEG格式的背景圖像P1,圖2(b)
9、為篡改來源圖像P2,圖2(c)為篡改合成圖像P3,其數(shù)學模型可用式(2)描述:
y(i, j)=A1⊙P1(i, j)+A2⊙P2(i, j)=AP(i, j)(2)
其中:y(i, j)為JPEG篡改合成圖像;⊙表示Hadamard積;P1(i, j)為一幅JPEG格式的背景圖像;P2(i, j)為其他圖像(可以是JPEG格式的圖像,也可以是其他無損壓縮格式的圖像);源圖像P(i, j)=[P1(i, j),P2(i, j)]T;置換混合矩陣A=[A1,A2]。這里 A1=1, (i, j)∈U10, (i, j)∈U2
A2=1, (i, j)∈U10, (i, j)∈U2
其中:U1∪U2=U,U1∩U2=。本文的目的就是僅僅根據(jù)篡改合成圖像分離出源圖像P(i, j)中的篡改區(qū)域。
三、JPEG圖像雙重壓縮中的雙量化效應
JPEG圖像進行第1次壓縮時,需要用量化矩陣QT1對DCT系數(shù)進行量化,得到量化后的DCT系數(shù)。而進行第2次壓縮時,則先把量化后的DCT系數(shù)乘以第一次量化矩陣QT1,再使用第2次量化矩陣QT2來進行量化操作。