第二章 数据预处理
2.1归一化
由于采集的数据集中存在着奇异样本数据,从气体数据集中可以看出,并不是每个特征的特征值都是统一在一个范围内,一些奇异样本数据大到几万,一些奇异样本数据小到负数,如果不进行归一化直接带入算法中进行计算,可能无法求出最优解,所以在学术上和工业使用上,对于一个不规范的源数据集都是要进行归一化,本文也就数据归一化进行了实验,实验中可以发现,不进行数据归一化而直接进行SVM求解最优超平面,参数寻优过程中寻找最优参数效率低,耗费时间成倍数增长,而且还无法找到最优解,详细可以参考第四章。 基于电子鼻的SVM模式识别算法的研究与实现(4):http://www.751com.cn/jisuanji/lunwen_32641.html