在一定程度上数字图像的像素分布可以反映图像内容的特征,而利用像素值的分布特征进行图像聚类,已经是目前对图像进行聚类的常用手段。图像聚类的性能主要是取决于图像的特征提取,图像的特征提取主要从颜色、形状、纹理等几个方面来提取图像特征。本文介绍了五种低层图像特征提取:(1)64文基于LAB的颜色直方图;(2)144文基于HSV的颜色相关图;(3)73文边缘方向直方图;(4)128文小波纹理特征;(5)225文基于LAB的块颜色矩。本文将这五种低层图像特征作为下面实验的依据。
为了更好的为图像聚类提供依据,使聚类更加合理,如何将多种图像特征融合在一起,也是至关重要的。Jang[6]等依据不同权值将各空间计算的距离进行加权组合得到图像间的相似度,这种方法的关键和难点在于距离函数以及各空间权系数的选取。Fan[3]等利用核函数计算不同特征的空间中图像的相似度,并通过核学习和用户反馈调整它们的结合权值。其难点在于不同的函数内核可以差异化描述不同的特征空间的特性,而相同的函数形式又可进行线性结合,计算图像间的相似度。而本文采取的是一种简单的方法,是将多种不同的图像特征拼接成高文向量,来作为图像的新特征,进而用来计算相似度。
通常,人们根据样本间的某种距离或相似性度量来定义聚类,即把相似的(或距离近的)样本聚成一类,而把不相似的(或距离远的)样本归在其他类中。基于相似度的聚类方法是实际中常用的方法,如K-means聚类算法、AP聚类算法等。经过实验,我们得出AP聚类算法比K-means聚类算法更适合应用于图像摘要,所以本文采用的是AP聚类算法。
代表性图像又称为图像范例,图像范例是指在图像聚类中,最能代表该类图像所具有的特征的图像。代表性图像可以通过聚类算法得到的聚类中心得出,但是有可能聚类中心与该类所表达的意思相聚甚远,造成代表性图像的选择不当。本文采取了一个简捷的方法,求得图像类中的平均特征向量,再通过找到与平均特征向量最接近的图像做为图像范例。
1.3 论文结构
本文首先在第二章对实验用到的理论和方法进行了叙述。2.1节描述了图像特征提取的五种低层特征提取,包括全局特征提取和局部特征提取,这些特征涵盖了颜色、纹理、形状等方面,为图像聚类提供了有效地依据;2.2节对图像相似度的计算方法进行了介绍,本文应用的是简单直观的欧氏距离算法,通过运算我们得到相似度矩阵作为AP聚类算法的输入;2.3节描述了AP聚类算法的运算原理和参数,AP聚类算法是本文的核心算法;2.4节介绍了图像范例的选择方法,本文应用的是选取图像特征向量最接近平均图像特征向量的图像作为范例图像;2.5节描述了图像摘要的流程和基于图像摘要的图像检索的步骤,包含图像摘要的流程图。
本文第三章对具体实现的程序代码进行了描述。3.1对MATLAB进行了简单介绍;3.2节对基于AP聚类算法的图像摘要的代码进行的描述与详细分析;3.3节介绍了K-means聚类算法和使用。
本文第四章展示了实验结果。4.1节主要描述了应用AP聚类算法的实验结果;4.2节主要介绍了AP聚类算法和K-means聚类算法实验结果的对比,以及AP聚类算法的优点。
本文第五章是对实验的展望,描述了在未来实验中还需继续改进的地方。
2 理论和方法
2.1 图像特征的提取
图像特征提取是指对某一模式的组测量值进行变换,以突出该模式具有的代表性特征的一种方法。通过影像分析和变换,达到提取所需特征的目的。本文提取了每张图片全局的和局部的特征值。 网络图像搜索中的图像摘要技术研究(2):http://www.youerw.com/jisuanji/lunwen_6340.html