基于KNN算法的机器嗅觉及白酒分类研究(4)

第751章是总结。这其中，以月份作为时间单位，主要介绍了在本次课题研究的过程中，在各个阶段所做的事情，遇到的问题等等。并且，对这些问题进行了一定的总结，包括了解自己擅长和不擅长的部分，以及对接下来的期望。
后面的三个部分分别为致谢、参考文献和附录。
在致谢中，表达了自己对大学生活这次毕业设计的感悟，以及之前遇到过的所有老师的感谢。
参考文献中，则列出了在本文中出现过的一些概念的论述出处，以及在撰写本文的过程中，所参考过的所有书籍的文献。
最后的附录列出了本次课题研究中所使用到的所有三类白酒的样本特征值，以及通过本次课题研究所最后得到的完整的程序代码。
2    技术概念及开发工具介绍
在上一章节的引言中，大概地描述了本次课题中所涉及到的领域，从意义最广的人工智能，到相对而言较小的模式识别等。在本章节中，将会在第一小节中对所有涉及到的知识点都进行详细的介绍。而在第二节小中，则会详细介绍在开发时所使用到的开发语言Java语言，和所使用的开发工具NetBeans IDE 8.0。
2.1    技术概念介绍
本小节将对本次课题研究中所涉及到的所有知识概念进行详尽且系统的介绍，其中包括人工智能、机器嗅觉、数据挖掘、模式识别以及KNN算法。
2.1.1    模式识别
前文也提到过，模式识别（Pattern Recognition），是通过计算机用数学技术方法来研究模式的自动处理和判读。[5]
模式识别又常被称为模式分类。从处理问题的性质和解决问题的方法等的角度来看，模式识别可以分为有监督的分类（Supervised Classification）和无监督的分类（Unsupervised Classification）两种。这两者的主要差别，在于各个实验样本所属的类别是否预先已知。一般来说，有监督的分类往往需要提供大量已知类别的样本来作为为位置类别分类的数据基础。但是在实际问题中，这是存在着一定困难的。因此，在缺少大量已知样本的的情况下，无监督的分类的研究就显得大有意义了。
模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等，属于概念识别研究的范畴，是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。
模式识别这项技术在数据预处理的时候用到，本次的课题研究中，涉及到的数据比之一般试验更为复杂，且量也较大，因此在程序中有专门的一个模块负责处理这些已知的样本数据，并且根据处理出来的结果进行未知数据的分析。
模式识别的主要方法有三个，分别是决策理论方法、句法方法，及统计模式识别方法。模式识别方法的选择取决于所需要解决的问题的兴致。如果，被识别的对象极为复杂，而且包含了非常多的结构信息，那么一般采用句法方法来解决问题；如果，被识别对象不是那么的复杂，或者并不含有明显的结构信息，那么一般采用决策理论方法来解决问题。值得一提的是，这两种方法并不能完全地分开。例如，在句法方法中，所选取的基元本身，就是利用决策理论方法来抽取的。而在实际应用中，将这两种方法结合起来分别施加于不同的层次，通常能收到更好的效果。
决策理论方法又称统计方法，是发展较早，也较为成熟的一种方法。首先，将被识别对象数字化，并将其变换为适于计算机处理的数字信息。因为，一个模式常常要用很大的信息量来表示。而许多模式识别系统在数字化环节之后还会进行数据预处理，来除去混入的干扰信息，并减少某些变形和失真。然后，进行特征抽取，即从数字化后或预处理后的输入模式中抽取一组特征。所谓的特征，是选定的一种度量，它对于一般的变形和失真保持不变，或是几乎不变，并且只含有尽可能少的冗余杂音信息。特征抽取的过程是将输入模式从对象空间映射到另外的特征空间。这时候，模式就可以用特征空间中的一个点、或者一个特征矢量来表示了。这种映射不仅压缩了需要处理的信息量，而且也易于之后的分类。在决策理论方法中，特征抽取占有非常重要的地位，但现在尚无通用的理论指导，只能够通过分析具体识的被识别对象来决定如何选取、选取何种特征。特征抽取之后可以进行分类，即从特征空间再映射到另外的决策空间。为此，引入了鉴别函数这个概念。由特征矢量来计算出相应于各个类别的鉴别函数值，然后通过鉴别函数值的比较来实行分类。基于KNN算法的机器嗅觉及白酒分类研究(4):http://www.751com.cn/jisuanji/lunwen_17244.html