式(2-4)还可以表示成下式的形式:
X矩阵可进一步表示为: (2-9)
其中: 分别为主元负荷矩阵和残差负荷矩阵, 分别为主元得分矩阵和残差得分矩阵,其中向量ti的长度反应了数据矩阵X在pi方向上的覆盖程度。它的长度越大,X在pi方向上覆盖程度或者变化范围也就越大。若得分向量按其长度做一下排列,那么负荷向量pi代表X变化的最大方向,p2与p1垂直并代表X变化的第二大方向,pm将代表变化最小的方向。[7]
但PCA有下列不足:
(1)仅仅依据方差的大小作为提取数据信息的准则,认为方差越大包含的信息越多,而方差并不能完全反映信息的多少;
(2)PCA是针对原始数据矩阵进行压缩的,与反应变量无关。
2.3 独立元分析法(ICA)
转换成统计意义下独立的多变量数据,适合非正态分布的数据的特征提取。其基本思想是:假设测量信号是一些相互独立的信源信号和过程噪声以及干扰组成,按照一定的非高斯性度量准则,从多元数据样本中提取相互独立和非高斯分布的独立成分。
与传统方法相比,ICA不仅除去了变量之间的相关性,而且还包含了它们之间的高阶统计特性,ICA方法得到的独立成分分量满足了统计意义上的独立性,因此独立主元分析比传统的统计方法包含了更多有用信息。ICA已经在盲源信号分离、生物医学信号处理、混合语音信号分离方面得到了较多的应用。[8]最早提出ICA概念的是Jutten 和Herault,认为ICA是从线性混合信号中恢复出基本源信号的方法。
独立成分分析法( ICA ) 最初是用来解决“鸡尾酒会”问题。由于主成分分析(PCA )和奇异值分解(SVD) 是基于信号二阶统计特性的分析方法,其目的用于去除图像各分量之间的相关性, 因而它们主要应用于图像数据的压缩;而ICA 则是基于信号高阶统计特性的分析方法,经ICA 分解出的各信号分量之间是相互独立的。正是因为这一特点,使ICA 在信号处理领域受到了广泛的关注。随着近年来在ICA 方面研究兴趣的增加,使它在许多领域也有了非常有趣的应用。[9]
假设有m个观测变量x1,x2,...,xm,它们分别是n(n<m)个非高斯分布的独立成分变量s1,s2,...,sn的线性组合。其中独立主元分析和测量变量都是已经归一化的数据,两者之间的关系为
(2-10)
其中 为m文观测矢量:ζ为观测噪声矢量。
ICA的目的就是就是要寻找一解混矩阵W,使得可由观测变量x得到相互独立的源变量,
(2-11)
其中y为s的估计矢量。当分离矩阵W为A的逆阵时,y就是源变量s的最佳估计。
近年来fMR I 成像技术日趋成熟,ICA 是一个从其他生理和非自然成分中,决定与任务相关的激活区的方法。它的每个成分由一个固定的三文空间分布的脑体素和一个相关的激活时间序列组成,ICA 的两种互为补充方法(s ICA 和t ICA ) 可以将一个图像序列分解成一系列图像和相应的一系列时变的图像幅度。 偏最小二乘算法在过程监控中的应用研究(4):http://www.751com.cn/zidonghua/lunwen_3154.html