K-SVD基于稀疏分类行人检测的字典训练_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

K-SVD基于稀疏分类行人检测的字典训练

摘要行人检测是目标检测中的一个热点研究领域,并且成为了越来越多研究者的研究课题。稀疏表示理论的快速发展,使得其在模式识别领域得到了越来越多的应用,也应用到了行人检测问题上。然而,在稀疏表示中,字典的学习是一个非常重要的步骤。通常,为了适应不同的输入信号的需求,训练学习到的字典都是过完备的。本文使用 K-SVD 字典学习算法来训练过完备的行人字典,采用稀疏表示实现行人检测,得到在行人检测中最优的字典尺寸。在此实验之后,提出了采用虚拟场景行人为训练集,来进行现实世界的行人检测。   31429
毕业论文关键词  K-SVD算法  字典训练 稀疏表示 多重稀疏行人检测 虚拟行人  
Title  Dictionary Training based on Sparse classification pedestrian detection
Abstract Pedestrian detection is a hot research field of target detection,  and becoming the research topic of more and more researchers. The rapid development of the sparse representation theory makes it more and more used in the field of pattern recognition, also used in the problem of pedestrian detection. However, in the sparse representation, the dictionary learning is a very important step. In order to meet the requirement of different input signal, the trained learning dictionary is  overcomplete. In this paper, we use  the  K-SVD dictionary learning algorithm to train a overcomplete pedestrian dictionary, then use sparse representation to achieve pedestrian detection, finally get the optimal size of dictionary in pedestrian detection. After the experiment, we put forward using virtual pedestrians as the training set to work on the real-world pedestrian detection.  
Keywords    K-SVD algorithm   dictionary learning   sparse representation   multiple sparse pedestrian detection   virtual pedestrian 
目次
1引言1
1.1国内外对行人检测的研究2
2图像稀疏表示原理6
2.1过完备稀疏表示6
2.2稀疏表示优化方法8
2.3字典学习11
2.4稀疏表示的应用14
3基于多重稀疏的行人检测方法15
3.1字典训练16
3.2多重稀疏字典直方图21
3.3多重稀疏字典特征提取23
3.4实验24
4虚拟行人训练集的生成28
4.1虚拟行人的生成28
4.2后期研究工作29
结论31
致谢32
参考文献33

1  引言 随着计算机视觉、模式识别以及人工智能等学科的快速发展,行人检测问题得到了越来越多研究者的广泛关注。行人检测一般是指从输入的图像或视频画面中确认行人目标的位置和大小的过程,在机器视觉、智能监控系统、车载主动安全等中发挥着至关重要的作用。虽然行人检测技术有着广阔的应用前景,但是行人检测需要面对很多复杂的难题,比如人体的大小姿态,场景的复杂多变等等。总结国内外研究者的研究成果,行人检测的主要研究任务是如何提取有效的行人特征信息和构造更加优秀的分类器。 在基于多重稀疏表示的行人检测方法中,研究者运用稀疏表示理论,预先利用行人图像学习多个不同的过完备字典,分别用每一个字典对行人进行稀疏表示,得到稀疏编码中的非零系数项所对应字典的基向量单元,并统计字典中相应的基向量的分布直方图,形成多重稀疏字典直方图,以此作为图像的特征,最后利用SVM分类器进行分类,达到行人检测的要求。  其中过完备字典的训练和统计字典中基向量得到分布直方图的过程在该行人检测方法中至关重要。然而,影响学习得到的字典的因素有字典的稀疏度、字典大小及输入图像尺寸块的大小。因此,本文主要研究这些因素对基于多重稀疏表示的行人检测方法的影响,并得到效果最好的字典尺寸。 在利用行人图像训练过完备字典的时候,行人图像的得到是由人工手动获得,这会由于人类主观因素影响行人图像的精确性,因此,我们大胆假设采用由电脑动画软件制作的虚拟行人图像作为训练字典的训练集,来用于真实行人图像的检测。本文先说明虚拟行人图像的生成,后期将完成行人检测过程。 1.1  国内外对行人检测的研究 1.1.1  行人检测难点 行人检测需要面对很多复杂的问题:一方面,人体极易受到光照、身体姿态、衣着等众多因素的影响,使得在行人检测中,精确度不是很高;另一方面,复杂、多变的场景图像数据的不断增多,图像数据表现的更加复杂,对计算机处理要求高等,使得行人检测的准确率低、检测的时间长。 (责任编辑:qin)