虽然人工智能的发展仍然存在这样那样的顾虑,比如未来机器会不会反过来统治人类等等,但这些担心依然不会影响人们追求机器智能化的脚步。图像识别技术一直以来受到人们广泛的关注,因为它确实与人们的生活息息相关,互联网的发展也加大了人们对于图像的利用,例如聊天时用的表情包。
在图像识别领域,目前的重点研究依然是图像归类方面的技术。一方面,面对如今网络图像资源爆发式的增长,如何将图片更好分类本身就是一个急需处理的问题。优质的图像归类系统可以优化图片的分类流程,大大降低图像的储存时间,降低图像的资源利用;另一方面,图像归类的好坏将决定了用户在检索图片时的体验,用户自然是希望检索图片时,第一张图片就是自己要的。
在图像归类领域,语义鸿沟问题一直是一个问题,即机器理解的低级图像语义特征与人类理解的高层语义特征存在一个理解上的差距,造成用户在检索时,检索出的图片不是所需的情况,用户依然需要自己在一堆图片里继续自己寻找。文献综述
但是这个问题现在随着人工智能的研究得到了解决。深度学习理论的运用很好地训练了机器学习图像的高层语义特征,从而解决了语义鸿沟问题,通过提取的语义特征,机器可以对图片进行更加复杂的分类,让用户可以使用更多人类使用的自然语言去精准搜索图片。而在更加广泛的图像识别领域,针对各种数据集的实验和研究已经让图像的识别达到很高的正确率,这离不开深度神经网络的背后支持。图像识别技术也已经广泛运用到实际生活当中去,比如收费站的电子不停车收费技术等等,可见在图像领域的应用上,深度神经网络的应用已经达到了一定的成熟度。
除了将提取的图像语义特征用于识别和图像归类,图像语义依然可以有其他的重要用途。在满足用户对所需图像的需求方面,除了使用基于深度学习的图像自动分类方式外,利用基于深度学习网络提取到的图像语义特征,让机器生成想要的图片似乎也是一种可行的方式,目前科研人员针对这方面也进行了研究。
2014年,Ian Goodfellow发表一篇论文[5],介绍了生成式对抗网络(Generative Adversarial Networks)。这给图像语义特征的运用产生了新的思路——利用机器提取到的图像语义特征进行生成图像,简单点说就是机器可以自己生成图像了。试想一下,如果用户在需要图片时,机器可以根据用户的需求自动生成图片,这样的效率会比从图像归类中搜索图像更为快速,准确,那么让机器自己生成用户的图像是否可行呢?本文将尝试利用最新的生成式对抗网络技术来解决图像生成问题,主要包括四个部分:第一部分是论文研究的环境根据,当前国际上的研究现状,以及研究的目标;第二部分是深度学习相关理论思想的研究;第三部分是基于Keras框架进行的研究实验与分析;第四部分是本次研究的总结与展望。
二、深度学习相关理论研究
本章将对于深度学习的相关基础知识进行概述,并对于后续实验中重点运用的卷积神经网络和生成式对抗网络相关理论进行分析与研究。
(一) 历史来:自[优.尔]论,文-网www.youerw.com +QQ752018766-
最早的深度学习思想演化于神经网络的探索[6]。人工神经网络(Artificial Neural Network)是模仿大脑处理信息的脑结构,将人脑神经元(图2。1)网络进行泛化,建立模型,并按照各自特点相互连合形成的网络。从生物学角度来说,人脑是目前生物体当中处理信息最快、最高效的,由大量神经元组成。多个神经元之间通过生物电进行信息的交换。一个神经元从多个神经元处接收到电信号,进行处理,并将处理结果以电信号的方式发向下一个神经元。由海量的神经元构成一个神经网络,对于大脑输入的数据进行处理。人脑神经网络的一个重要的特点是它对于信息的处理不是单层次的,而是分成多层次,对信息进行逐层处理。多层处理的优势在于可以降低复杂信息的维度,降低信息解析的难度。深度神经网络就是模仿这种多层次的信息解析方式,从而提升信息解析的效率。 深度学习的图像语义提取研究(3):http://www.youerw.com/jisuanji/lunwen_94166.html