1.2.6 基于密度的方法
划分和层次方法是为了发现球状簇,但是他们难以发现任何形状的簇。为了发现任何形状的簇,作为选择我们可以将簇看做数据空间中被稀疏区域分开的稠密区域。主要思想是只要对象或者是数据点的数目超过某个阈值,就继续增长给定的簇。也就是说,对于给定簇中的每个数据点,在给定的半径领域中必须至少包括最少数目的点。这是基于密度聚类方法的主要策略。三种代表性的方法为DBSCAN、OPTICS和DENCLUE。此外,可以将基于密度的方法从整个空间聚类扩展到子空间聚类。文献综述
1.2.7 基于网格的方法
之前讨论的所有算法都是数据驱动的,他们划分对象集并将他们自动适应嵌入空间中的数据分布。另外,基于网格的聚类方法采用空间驱动的方法,把嵌入空间划分成独立于输入对象分布的单元。经典方法有STING聚类和CLIQUE聚类。
对于许多空间数据挖掘问题,使用网格一般都是有效的方法。因此,基于网格的方法一般与其他聚类方法集成使用,比如基于密度的方法和层次的方法