1.2 本论文的研究思路及所作主要工作
在Catie Chang 发表论文中,时频分析的概念被引入到了相干性的理论中来[12],从而动态变化的fMRI信号之间的关系就能很好的用相干性的概念表示出来。
然而,那篇论文只解决了计算2个信号之间相干性的问题,但是这并不能直接反应脑功能连接性的状况。因此,更值得关心的是2个脑区域之间存在什么样的关系,这就必然涉及到来自2个区域间很多信号之间的比对和它们之间的分析。但是,仅仅对每个信号两两分析并不能得到2个区域间的关系。所以本论文决定通过对fMRI信号进行聚类,然后进行聚类之间的相干性分析,从而得到对2组信号之间一个整体功能性连接的估计。
因此本文的主要工作分为三部分:
1. 模拟fMRI信号,观察对比真实fMRI信号,对所要分析的fMRI信号进行预处理。
2. 对同一组内的fMRI信号进行聚类分析。
3. 对每组内每个聚类的代表信号进行小波变换相干性分析。
2 fMRI信号聚类的设计与实现
2.1 聚类的概念
迄今为止, 聚类还没有一个学术界公认的定义。这里给出Everitt在1974年关于聚类所下的定义[13]:一个类簇内的实体是相似的,不同类簇的实体是不相似的;一个类簇是测试空间中点的会聚,同一类簇的任意两个点间的距离小于不同类簇的任意两个点间的距离;类簇可以描述为一个包含密度相对较高的点集的多文空间中的连通区域,它们借助包含密度相对较低的点集的区域与其他区域(类簇)相分离。
2.2 聚类分析算法的分类
传统的聚类分析计算方法主要有如下几种[14]:
1. 划分方法(partitioning methods)
给定一个有N个元组或者纪录的数据集,分裂法将构造K个分组,每一个分组就代表一个聚类,K<N。而且这K个分组满足下列条件:(1)每一个分组至少包含一个数据纪录;(2)每一个数据纪录属于且仅属于一个分组(注意:这个要求在某些模糊聚类算法中可以放宽);对于给定的K,算法首先给出一个初始的分组方法,以后通过反复迭代的方法改变分组,使得每一次改进之后的分组方案都较前一次好,而所谓好的标准就是:同一分组中的记录越近越好,而不同分组中的纪录越远越好。使用这个基本思想的算法有:K-MEANS算法、K-MEDOIDS算法、CLARANS算法;
2. 层次方法(hierarchical methods)
这种方法对给定的数据集进行层次似的分解,直到某种条件满足为止。具体又可分为“自底向上”和“自顶向下”两种方案。例如在“自底向上”方案中,初始时每一个数据纪录都组成一个单独的组,在接下来的迭代中,它把那些相互邻近的组合并成一个组,直到所有的记录组成一个分组或者某个条件满足为止。代表算法有:BIRCH算法、CURE算法、CHAMELEON算法等;
3. 基于密度的方法(density-based methods)
基于密度的方法与其它方法的一个根本区别是:它不是基于各种各样的距离的,而是基于密度的。这样就能克服基于距离的算法只能发现“类圆形”的聚类的缺点。这个方法的指导思想就是,只要一个区域中的点的密度大过某个阀值,就把它加到与之相近的聚类中去。代表算法有:DBSCAN算法、OPTICS算法、DENCLUE算法等;
4. 基于网格的方法(grid-based methods)
这种方法首先将数据空间划分成为有限个单元(cell)的网格结构,所有的处理都是以单个的单元为对象的。这么处理的一个突出的优点就是处理速度很快,通常这是与目标数据库中记录的个数无关的,它只与把数据空间分为多少个单元有关。代表算法有:STING算法、CLIQUE算法、WAVE-CLUSTER算法; fMRI中的时序信号比对分析+文献综述(3):http://www.751com.cn/jisuanji/lunwen_7269.html