2 综合评价方法模型
2.1 因子分析
因子分析是采用降维的思路,按照相关性的大小对原始变量进行分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量体现,这个基本结构称为公共因子。在某一具体问题中,我们可以尝试用最少个数的不可测的公共因子的线性函数与特殊因子之和来表述原来观测的每一分量 。它的具体步骤为:
(1)观察原始变量是不是适合做因子分析。
(2)从中提取因子并求解因子载荷矩阵。
(3)旋转因子的解释。
(4)列出因子得分函数
(5)求得每一个样本的因子得分 。
2.2 聚类分析
聚类分析是统计学中一种研究“物以类聚”问题的多元统计方法。在聚类分析的发展
过程中,使用得最多、最成熟的方法为K-means聚类分析法,所以本文将采用K-means聚类方法。其分析思路为:聚类分析是将许多样本或变量按照它们在性质上的亲疏程度加以区别,进而给出分类。本质是依照距离的长短将若干数据分为几个大类,以使得类内数据的差异尽可能的小,类间数据的差异尽可能的大 。
本文利用K-means聚类分析方法,将因子分析所得到的因子得分作为新变量进行聚类分析,根据其结果来划分学生类别。它的具体步骤为:
(1)把样品粗略的分为K个初始类别。
(2)不断进行修正,逐一分配样本到其最近均值的类中去。重新计算得到新样本的类和失去样本的类的均值。
(3)重复第二步,直到没有元素进出 。
3 实例分析
3.1 数据来源和数据处理
数据来自于我校统计学专业2010级51名本科学生大学四年的学习成绩资料(见附录),从中选取了20门必修课程成绩,并且对原始数据做了如下几方面的处理:
(1) 所有课程的成绩都按期末成绩记录,不包括重考或重修的成绩:
(2) 维持课程的百分制分数 。
其中,20门课程分别为:高等数学(1),高等数学(2),线性代数,运筹学,经济数学模型,西方经济学(微观),西方经济学(宏观),会计基础,成本会计,概率论与数理统计,统计学原理,统计软件,多元统计分析,时间序列分析,抽样调查,大学英语(1),大学英语(2),大学英语(3),大学英语(4),高级语言程序设计(VB)。
下面借助SPSSl9对上述有关数据进行因子分析和聚类分析。
3.2 学生成绩的因子分析
(1) 首先将原始数据输入SPSS19软件,对20个原始变量作KM0检验和巴特利特球形度检验。结果见表1。
表1 KMO 和 Bartlett 的检验
取样足够度的 Kaiser-Meyer-Olkin 度量 .874
Bartlett 的球形度检验 近似卡方 865.992
df 190
Sig. .000
KMO检验统计量是用于对比变量间简单相关系数和偏相关系数的指标,KMO统计量
越大表示越适合做因子分析,其中若低于0.5,则意着极为不适合。而Bartlett球形检验统计量近似服从卡方分布,若该统计量的观测值较大,且相对应的P值小于既定的显著性水平,那么就可以认定相关系数矩阵不可能是单位矩阵,原有的变量就适合做因子分析 。
由上表可知,KM0的统计量取值0.876大于0.8,Bartlett球形度检验的卡方统计值为865.992(P<0.001),这两个统计指标值都表明,本文原始数据可以进行因子分析的研究。 统计学专业培养方案下学生成绩的统计与分析(2):http://www.751com.cn/shuxue/lunwen_59445.html