基于模型假设1:每张载波片上的每个圆斑的颜色近似看作一种颜色,所以对于每个中心点我们以之为圆心,取一个相对较小的半径2画圆,取这个圆内所有特征像素点的色度(R,G,B)的平均值,可以有效表征该圆斑的颜色信息。即每张卡片上的每个圆斑都能通过一个色度向量来代替。如此得到与该图片包含的有效信息基本等量的36个色度向量,按照公式1的放置格式得到如表1所示的色度数据形成108 1的向量。
(公式1)
如此遵循图8所示的图像数据提取流程,参照上述样例的具体操作过程完成题目中所有图像的数据提取过程。为接下来的模型建立及求解准备好数据资源。
问题2:分类模型的构造及判定
5.2.1:四个已知类别的编号
为了便于算法描述,程序执行我们对已知的四个类别分别进行编号如下表2
表2:四个已知类别编号
类别名 Tea_Orange Tea_orangespice Tea_spiced_chai Tea_sweet
对应编号 1 2 3 4
5.2.2:各个类别中心点的求解
为了便于待判定样本分类模型的建立以及后续模型的求解,我们需要知道每个样本到各个类别的距离。而对于到类别的距离,我们采取待判定样本到每个已知类别的中心点的距离来计算,所以基于以上情况,我们需定义一个求解各个已知类别中心点的算法,如公式2所示:
(公式2)
为第i类样本的中心点,为 的向量。
在matlab中把此算法编程实现,求解出各个类别的中心点。
5.2.3 欧氏距离求解
由于我们提取后的数据,是一个降文为一文存放的向量,我们可以采用公式(3)来计算待判定数据和已知类别的数据之间的距离:
通过matlab编程,即可求出第 个待判定样本与第 类数据的空间距离。
最后比较 , , , 的大小即可判别第 个待判定数据的类别。
5.2.4 兰氏距离求解:
同理对于利用兰氏距离,运用同样的方法,编程实现其算法再次对待测样本进行分类。
5.2.5 分类模型科学性检验
通过分析可以发现,欧氏距离和兰氏距离侧重点各不相同,为了以后分析的正确性,与科学性,我们用交叉确认估计分析法分别对两种判定方法的误判率进行求解。
5.2.5.1 交叉确认估计分析法的过程
交叉确认估计分析法的核心是通过对已知类别的再次判定,与已知的类别结果进行比较,来计算判定方法的的误判率