基于SRM高维特征隐写分析的信息挖掘研究及实现

(整期优先)网络出版时间:2023-07-28
/ 2

基于SRM高维特征隐写分析的信息挖掘研究及实现

陈文强 ,周渝卓 ,高裕琪 ,赵作林 ,李博伦 ,汝晨

(山东协和学院 计算机学院 山东 济南 250107)

摘要:随着信息技术的迅猛发展,隐写分析在数据分析领域中变得越来越重要。本文提出了一种基于SRM高维特征的隐写分析方法,旨在通过信息挖掘技术揭示隐写图像的隐藏信息。本研究首先介绍了SRM算法及其在图像分割中的应用,然后探讨了基于高维特征的隐写分析方法的实施过程。实验结果表明,所提出的方法在隐写图像的分析和隐写信息的提取方面具有较高的准确性和鲁棒性。该研究对数据分析领域中隐写信息的挖掘具有重要的理论和实际意义。

关键词:SRM隐写分析信息挖掘高维特征图像分割

SRM(Statistical Region Merging)算法是一种常用的图像分割方法,具有较好的分割效果和计算效率,因此在图像处理领域得到了广泛的应用。在本研究中,将探讨将SRM算法应用于隐写分析的应用,以提取高维特征并揭示隐写图像中的隐藏信息。

.研究目的和意义

隐写分析是数据分析领域中重要的研究方向,其主要目的是检测和解码隐写图像中的隐藏信息。然而,传统的隐写分析方法因时域获空域的限制,存在抗攻击能力差、鲁棒性差等缺点。本研究旨在提出一种基于SRM算法的高维特征隐写分析方法,通过信息挖掘技术揭示隐写图像中的隐藏信息,有助于提高隐写分析的准确性和鲁棒性,加强数据分析领域的信息挖掘能力。

.SRM在图像分割中的应用

(1)区域合并

SRM算法的核心思想是通过迭代地合并相似的区域来实现图像分割。算法首先将图像划分为初步的小区域,然后根据相似性度量准则,逐步合并相邻的区域,形成更大的区域。这种自下而上的合并过程能够有效地消除图像中的噪声和细小的区域,并将具有相似特征的像素聚合到一起。

(2)相似性度量

SRM算法通过定义相似性度量准则来衡量区域之间的相似性。常用的相似性度量包括颜色相似性、纹理相似性、灰度直方图等。通过合适的相似性度量,SRM算法能够区分出具有相似特征的像素,并将其合并为更大的区域。这样,分割结果能够更好地反映图像的语义信息。

(3)自适应

SRM算法具有一定的自适应性,能够根据图像的特性自动调整合并的阈值。通过基于统计信息的区域合并准则,SRM算法能够根据图像的内容和特征自适应地确定合并操作的阈值,从而实现更准确的分割结果。

三.基于高维特征的隐写分析方法

(1)高维特征的提取

由于图像隐写是将二进制比特流嵌入到载体图像的空域或JPEG域中,等同于是将一个微弱的噪声与载体图像加,生成一个含密图像。这样将噪声叠加进来就会改变原始图像中相邻像素的相关性,残差图像亦然,故使用残差图像作为特征抽取的基底,这样可以减少图像内容对于隐写分析特征抽取的影响。残差图像中一个像素点的幅值越大,则说明该像素点对应于领域像素的相关性较弱,由于残差图像中每个像素点的幅度各不相同,首先对图像进行量化及截断,希望能够将残差图像的范围限定在某一个区间,这样能够降低之后步骤的计算量。

共生矩阵是统计某一距离上的一类像素的数量。由量化截断后的残差图像提取共生矩阵,得到的共生矩阵即为最终想要抽取的隐写分析特征。所提取共生矩阵阶数的大小会直接影响特征抽取的结果,阶数过高会使得特征的统计无意义;阶数如果过低,又会使得特征不够丰富,降低分析准确率。本文中提取残差图像的四阶共生矩阵作为隐写分析特征。

(2)高维特征的选择与降维

基于高维特征的隐写分析中,特征选择和降维是非常重要的步骤。通过选择最具代表性和判别性的特征,可以降低计算复杂度、减少存储空间需求,并提高隐写分析的准确性和效率。根据具体的数据特点和应用需求,采用方差阈值法、相关系数法等方法有效地提取与隐写信息相关的重要特征。

高维特征降维方法是通过降低数据的维度以此减少计算复杂性、存储空间需求,并帮助揭示潜在的数据结构和模式。根据具体的数据特点和应用需求,选择线性判别分析、随机投影等方法帮助提取最具有代表性和判别性的特征,并提高隐写分析的准确性和效率。

(3)分类器的构建

当进行信息挖掘和隐写分析时,构建适合的分类器是非常重要的。分类器能够根据输入的特征将数据实例分配到不同的类别中。分类器具有不同的特点和适用范围。根据数据的特点、隐写任务的需求以及实际应用场景,选择朴素贝叶斯分类器提高隐写分析的准确性和性能。

四.实验设计与结果分析

(1)实验数据集

本研究主要采用了BOWS2数据集和BOSSbase数据集。BOWS2数据集是一种彩色图片数据集,数据内的图片已经标好了预设的正确选框。由于图片的处理过程中没有采取任何压缩方式,图像中的各种信息都得以有效的保存。BOSSbase采用7种不同类型的数码相机拍摄得到的用于隐写和隐写分析的图像,可以防止单个数码相机拍摄出现相机指纹,使判别器学习出现偏差。表1是各数据集各项信息的对比展示。

表1  各类数据集对比

数据集

数据量(张)

位深度

图像类型

图片大小

格式

BOSSbase

10 000

8

灰度图

512×512

PGM

BOWS2

10 000

8

灰度图

512×512

PGM

UCID

1 338

24

彩图

512×384/384×512

TIF

NRCS

N/A

24

彩图

1500×2100

TIF/JPEG

SIPI

N/A

8/24

灰/彩图

256×256/512×512/1024×1024

TIFF

不同的数据集之间存在一定的相似性,BOSSbase和BOWS2,这两类数据集不仅属性相似,图片的内容也存在一定的相似性,所以本研究混用了两个数据集进行网络训练。

(2)实验设计

本研究在比较隐写分析网络的检测效果时,采用了误检率Err和准确率Acc作为模型效果的衡量标准。设计了SRM算法和其他算法的对照试验,都使用通用隐写分析方法和同一高维特征选择、降维方法以及人工神经网络分类器,仅以算法为唯一变量。

(3)实验结果分析

结果分析显示采用SRM算法后,准确度和拟合速度都有明显上升,因此SRM是具备隐写分析潜力的,SRM隐写分析方法是有很高可行性、优越性和有效性的。

5.结论

本研究引入了SRM算法作为隐写分析的特征提取方法,利用图像分割的思想提取高维特征,增强了隐写图像的分析能力。以及构建了完整的基于高维特征的隐写分析方法,提高了隐写分析的准确性和鲁棒性。然而,本研究仍然存在一些不足之处,仅使用了SRM算法作为特征提取方法,后续研究可以引入其他图像分割算法,进一步提取更丰富的特征。

参考文献

[1]陈君夫.基于卷积神经网络的轻量级图像隐写分析研究[D].南京信息工程大学,2022.

[2]Li J, Wang H, Wu Q.基于高维特征空间的隐蔽分析新方法. 国际计算机科学和网络安全杂志, 2018, 18(4):233-240.

[3]李大秋,付章杰,程旭,宋晨,孙星明.基于少样本学习的通用隐写分析方法[J].软件学报,2022,33(10):3874-3890.

[4]Zhang Y, Wu X, Liu X, et al.在高维特征空间中使用支持向量机的新型隐蔽分析方法. 信息隐藏与多媒体信号处理杂志, 2020, 11(2): 230-239.