2.2 HVS特性研究
对于人眼的视觉特性,人们进行了大量长期的研究。但是,由于人眼结构的复杂性和人的主观因素等,这项研究的进展并未达到理想的程度。到目前为止,人们结合视觉生理学、心理学等多门交叉学科的研究,发现HVS的很多特点,主要表现为各种视觉掩盖效应。这些特性直接或间接地影响着人们对图像进行处理和质量评价。如在图像压缩编码技术中,我们可以利用HVS的各种视觉特性来掩盖压缩后带来的失真,以达到在图像主观感觉失真相同的情况下允许较大的失真;又如,如果我们在图像质量评价过程中,考虑到HVS的特性,会使客观评价值更符合图像的视觉质量。
2.2.1 视觉感知的多通道特性
对初级视皮层的研究表明,皮层中特定的神经元对某些特定方向和频率的视觉刺激有响应。这证明了人类视觉系统内存在着一系列彼此独立的、对不同空间频率具有选择性的通道,这些通道感受一定频率范围和方向的视觉信息。通过感知滤波器组分解模拟人类视觉系统多通道视觉信息处理的感知信道,对输入的图像进行空-频分解,形成特定方向、特定频率范围的子带图像,以便构建感知模型。这些结果进一步被模式识别及有关相互作用现象研究的心理物理学实验所证实。文献综述
2.2.2 对比度掩盖效应
对比度掩盖效应[6]是指当另一信号出现在刺激信号背景中时,刺激信号的可视度降低,即对比度阈值增加,也就是说,刺激信号在超阈值背景下会被掩盖掉。对比度掩盖效应可以使人眼对不同的频率具有相同的可视敏感度,它反映了激励之间的相互作用,是视觉系统的一个重要特性。通常情况下,当掩膜信号与目标信号有相似的特征时,如相似的空间频率、方向和位置,容易造成目标信号某些部分的可视度降低或升高。
3 图像失真类型
3.1 EG压缩
EG(Joint Photographic Experts Group)是一个由ISO和IEC两个组织机构联合组成的一个专家组,负责制定静态的数字图像数据压缩编码标准,这个专家组开发的算法称为EG算法,并且成为国际上通用的标准,因此又称为EG标准。EG是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。
EG专家组开发了两种基本的压缩算法,一种是采用以离散余弦变换(Discrete Cosine Transform,DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的无损压缩算法。使用有损压缩算法时,在压缩比为25:1的情况下,压缩后还原得到的图像与原始图像相比较,非图像专家难于找出它们之间的区别,因此得到了广泛的应用。
EG是一种很灵活的格式,具有调节图像质量的功能,允许用不同的压缩比例对文件进行压缩,源:自~优尔·论`文'网·www.youerw.com/支持多种压缩级别,压缩比率通常在10:1到40:1之间,压缩比越大,品质就越低;相反地,压缩比越小,品质就越好。当然也可以在图像质量和文件尺寸之间找到平衡点。EG格式压缩的主要是高频信息,对色彩的信息保留较好,适合应用于互联网,可减少图像的传输时间,可以支持24bit真彩色,也普遍应用于需要连续色调的图像。
EG压缩采用以离散余弦变换算法为主的区块编码方式。离散余弦变换算法(Discrete Cosine Transformation,DCT)是经典谱分析常采用的工具,它考察整个时域过程的频域特征或整个频域过程的时域特征,而对于非平稳过程,这种算法则显得力不从心。图像数据被压缩成正方形8×8的“像素信息模块”并按照一定顺序排列存储形成压缩文件,每一次压缩都需要舍弃若干频率信息,压缩得越多,舍弃的频率信息也越多,经过彻底压缩后的图像文件将只保留最为重要的数据信息,这样的压缩过程在图像细腻平滑程度方面必然有所损失