基于KNN算法的机器嗅觉及白酒分类研究(3)
时间:2018-06-08 21:15 来源:毕业论文 作者:毕业论文 点击:次
电子鼻是利用气体传感器阵列的不同的响应图案,来识别气的电子系统。电子鼻甚至可以在几小时、几天乃至数月的时间内连续地、实时地监测特定位置的气状况。电子鼻甚至能够测定有毒气体,亦可以进行远距离操作,这可比人为地测定气体的限制少了许多。 电子鼻主要由气取样的操作器、气体传感器阵列和信号处理系统三种功能器件组合而成。其中,电子鼻的核心器件是气体传感器阵列。电子鼻识别气的主要原理是依靠在阵列中的每个传感器对被测气体具有的不同的灵敏度。例如,一号气体可在某个传感器上产生高响应,但是却对其他传感器则是低相应。同样地,二号气体产生高响应的传感器可能对一号气体则不敏感。归根结底来说,整个传感器阵列对不同气体的响应图案是不同的。正是这种区别,才使系统能够根据不同的传感器的响应图案来识别气。 电子鼻正是利用各个气体传感器对复杂成分气体都有响应却又互不相同的这一特点,借助数据处理方法来对多种气进行识别,从而对气质量进行分析与评定的。 本课题中的一项重要的概念技术,KNN算法,可以说是数据挖掘中的一项最基本的算法。 KNN算法的核心思想是:如果某个样本在特征空间中的k个最相似的样本中的大部分属于某一个类别,则该样本也属于该类别,并具有这个类别中样本的所有特性。该方法在确定分类时,只根据最邻近的一个或者几个样本的类别来决定未知样本的所属类别。 K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。[4]KNN算法在整个程序中亦是起到了非常重要的作用,没有这个算法,本课题就无法进展下去。 1.1 全文内容简介 本文以研究白酒分类为主题,其内容为通过电子鼻以及KNN算法来对白酒芳香的特征值进行数据分析和比较。以已有的大量数据位基础数据库,通过算法预处理模块进行数据的处理与类比较。至此为程序内部所进行的前期工作,之后才是用户可以直接观察得到的部分:特征值的录入、内部数据的分析和比较、以及最后结果的输出显示。 本文将按照一下的顺序来进行本次课题的研究。 第一章为引言,即为绪论。大致地介绍了本次课题中出现的相关的知识与概念,以及本文的大致内容。 第二章为概念技术及开发工具的介绍。其中,第一小节详细且系统地介绍了本次课题研究中所涉及的各个方面的知识与概念,包括了模式识别、机器嗅觉、KNN算法和电子鼻。第二小节主要介绍了本次课题研究中所使用的编程语言,Java语言和开发工具NetBeans IDE 8.0。 第三章为本次课题研究的实验对象的介绍。主要是对在本次课题研究的过程中所使用的素材——白酒进行详细的介绍,包括了白酒分类研究的概况、白酒的香型介绍以及对白酒分类的设计。这部分的介绍基于寒假期间所进行的调研所得到的数据。 第四章为程序的详细介绍。其中,对整个程序分功能模块地介绍了程序中较为主要的各个部分。在第一小节中,主要概括地介绍了整个程序的主流程;而在第二小节中,则是以程序的每个功能模块为单位,主要从流程的角度,对每一个小功能模块进行详细的介绍。 第五章是调试与小结。这一章的内容是按照一般用户使用程序的过程来对整个程序进行调试,介绍了调试过程中的几个细节问题,以及在程序调试过程中所遇到的问题和解决方法。 (责任编辑:qin) |