经过这种标准化处理之后,消除了每个指标的量纲,也在一定程度上消除了各个指标值计量单位大小的影响,使得指标的值可以以数字的形式在指标之间与样本之间进行对比分析。
3、主成分分析法介绍
在保留原始变量尽可能多信息的前提下,采用降文的思想把构成模型的众多指标简化为少数几个综合指标的一种多元统计方法就叫做主成分分析法。
假设有两个样本,在每个样本之中有p项指标,而这p项指标之间通常情况下会具有或强或弱的相关关系,由于指标众多难以通过p项指标来区分和辨别这两个样本,但又必须归纳出少数几个相互之间不相关的综合性指标去尽可能多地综合p项指标的信息。假设X=(X1,X2…,Xn)是一个p文随机向量,且E (X) = u,协差阵D (X) =V。线性变换:
则有
如果 满足
并且
则称 是X的所有的组合之中最具有代表性的反映p个变量信息的线性组合方程式。结合上文,如果一个科技竞争力测度不足以代表原p个变量指标所包含的信息,就考虑采用 ,即科技竞争力测度扩展为两个。为了最有效表述原变量的信息, 己包含的代表科技竞争力的指标就不需要出现在 中,即满足 ,于是求 ,使其满足 并且 ,则把 称为第二主成分。依此类推,可以得到第三个科技竞争力测度、第四个科技竞争力测度,等等。
主成分分析的目的是减少变量的个数,因此,一般根据计算得出的方差的累积贡献率而选用m个主成分(m<p)。在实际问题中,往往采用p项指标n个样本的样本协方差矩阵S来替代p项指标的协方差矩阵V。 科技竞争力的测度与综合评价(5):http://www.751com.cn/shuxue/lunwen_9799.html