在国外验证码识别的研究已经成为一个热门的领域,并逐渐成为一个产业,关于验证码识别的理论体系也已日渐趋于完善。从目前研究情况看,验证码识别方法主要分为三类:基于模板匹配的方法、基于字符结构的方法、基于神经网络的方法[3]。82943
2003年,Mori[4]使用基于形状上下文破解方法,对EZ-Gimy产生的具有复杂背景的验证码进行破解,对于只含有单个词汇的验证码图片,取得了92%的成功率[5]。2005年,Edward Aboufadel, Julia Olsen和Jesse Windle[6]通过将字符旋转至水平并对单个字符应用Harr小波滤波结果作为特征,以接近100%的识别率破解了the Holiday Inn Priority Club的验证码[7]。同年,Kumar Chellapilla和Patrice Y。Simard[8]提出在验证码识别中,分割是比识别更困难的问题。2008年,Jeff[9]等人使用较为简单的图像处理算法,以90%的成功率破解了微软在Hotmail和MSN使用的验证码[5]。2013年,Sajad[10]提出了“SeeSay-HearSay”的新型验证码,主要用于移动互联网平台上,这也是移动互联网和语音识别发展的产物。论文网
国内对于验证码的使用和研究起步都比较晚,系统研究领域还是空白。2007年,苏磊[11]等讨论了形状上下文在验证码识别中的应用。同年,张淑雅[12]等人对SMTH-BBS验证码进行分割识别,分割后的单个字符分别采用K近邻法、 BP神经网络、SVM进行识别,识别率均在95%以上[7]。2009年,左保河[13]等采用神经网络的方法对验证码进行识别。2011年,王璐[7]在验证码破解中,使用字符识别算法,并通过实验得出结论卷积神经网络字符识别算法在验证码字符识别方面性能优异。2013年,杨思发[14]使用基于背景细化的字符分割方法,对粘连验证码进行分割,在某些验证码图片的分割上取得了较好的分割效果。
在专门针对3D文本验证码破解的研究上,迄今为止国内外的研究还不多。文献[15]研究了Ku6网站上使用的一种新型3D空心字符验证码,并采用颜色填充算法提取字符前景,再根据字符侧面与前表面宽度差异将二者进行区分标记,继而根据位置信息分别对各侧面和前表面碎片进行融合已形成字符掩膜[1]。文献[16]分析了三种基于文本的3D验证码,并利用像素空间线性方向的变化、像素密度、网格大小变化等特征各自设计了字符提取算法。