当前社会上对于数据进行分析并进行综合评价的方法很多,根据权重确定方法的不同,大致可以分为两类:一类是主观赋权法,如层次分析法,德尔菲法,等等。这些方法因为受到人为的主观判断等多种因素的影响,对于部分指标多少会有放大或缩小的作用,这也将导致最终的分析结果不能真实客观地反映出指标与事物间的现实关系。还有一类方法是客观赋权法,也就是根据各指标间的相关关系或各指标的变异程度来确定权数,以此来避免各种人为因素带来的分析结果的偏差,这类方法有主成分分析法、因子分析法等等。本文介绍的主成分分析法在将原始变量转变为主成分的过程中,形成了反映主成分和指标包含信息量的权数,以方便计算各指标的综合价值,这种方法在指标权重的选择上避免了何种人为因素的影响,可以真实客观地反映样本数据之间的相关关系。
为了更好地说明主成分分析在综合评价中的应用,我们需要选择规模较大,经营稳定,信誉较好的上市公司为例进行分析实践。本文选取了迄今为止已上市的五大国有银行作为样本,进行主成分分析。
2 主成分分析法的介绍
2.1 主成分分析法的基本思想
主成分分析也称主分量分析,源^自#751/文-论/文]网[www.751com.cn,是由霍特林于1933年首先提出的。主成分分析主要利用降维的基本思路,在损失尽量少信息的前提下争取把多个指标转化为少数几个综合指标的多元统计方法。通常把转化生成的综合指标称为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使转化得到的主成分能够比原始变量在某些方面具备更优秀的性能。通过这种方法,人们在研究较为复杂的问题时就可以在不损失太多信息的前提下只考虑少数几个主成分,从而更容易抓住问题的主要矛盾,揭示事物内部变量之间的规律,同时又使复杂的问题得到一定的简化,提高了数据分析的效率。
通过主成分分析得到的主成分与原始变量之间有如下基本关系:
每一个主成分都是原始变量的线性组合
主成分在数量上远远少于原始变量
主成分保留了原始变量绝大多数信息
各主成分之间互不相关
2.2 主成分分析法的基本理论
假设分析对象有p个指标,分别用X_1,X_2,…,X_P表示,这p个指标构成的p维随机向量为X=(X_1 〖,X〗_2,…,X_P)。设随机向量X的均值为μ,协方差矩阵为Σ。
对X进行线性变换,形成了新的变量,用Y表示,也就是说,新的综合变量可以由原来的变量线性表示,即满足下式:
{█(Y_1=u_11 X_1 〖+u〗_21 〖X_2+⋯+u〗_p1 X_p@Y_2=u_12 X_1+u_22 X_2 〖+⋯+u〗_p2 X_p@…@Y_p=u_1p X_(1+) u_2p X_2+⋯+u_pp X_p )┤
因为可以随意对原始变量进行上述的线性变换,由不同的线性变换得到的综合变量Y的统计特性也不完全相同。因此为了取得较好的效果,我们总是希望Yi=ui’X的方差尽可能大且各Yi之间相互独立,由于
var(Yi)=var(〖u^'〗_i X)=〖u'〗_i Σu_i
而对任意常数c,有
var(c〖u^'〗_i X)=c^2 〖u'〗_i Σu_i
因此对ui不加限制时,可使var(Yi)任意增大,问题将变得没有意义,我们将线性变换约束在下面的原则之下:
u_i^' u_i=1(i=1,2…p).
Yi与Yj相互无关(i≠j;i,j=1,2,…,p)。
Y1是X_1 〖,X〗_2,〖…,X〗_p所有线性组合中方差最大者,…,Y_p是与Y_1,Y_2,…,Y_(p-1)都不相关的X_1 〖,X〗_2,…,X_p的所有线性组合中方差最大者。
- 上一篇:浅谈线性方程组迭代求解
- 下一篇:数形结合在初中数学中的应用
-
-
-
-
-
-
-
java+mysql车辆管理系统的设计+源代码
中考体育项目与体育教学合理结合的研究
十二层带中心支撑钢结构...
大众媒体对公共政策制定的影响
电站锅炉暖风器设计任务书
河岸冲刷和泥沙淤积的监测国内外研究现状
杂拟谷盗体内共生菌沃尔...
酸性水汽提装置总汽提塔设计+CAD图纸
当代大学生慈善意识研究+文献综述
乳业同业并购式全产业链...