毕业论文

打赏
当前位置: 毕业论文 > 计算机论文 >

K-means算法WEB文本挖掘中的聚类研究(4)

时间:2021-03-29 20:40来源:毕业论文
1.2.6 基于密度的方法 划分和层次方法是为了发现球状簇,但是他们难以发现任何形状的簇。为了发现任何形状的簇,作为选择我们可以将簇看做数据空间

1.2.6  基于密度的方法

划分和层次方法是为了发现球状簇,但是他们难以发现任何形状的簇。为了发现任何形状的簇,作为选择我们可以将簇看做数据空间中被稀疏区域分开的稠密区域。主要思想是只要对象或者是数据点的数目超过某个阈值,就继续增长给定的簇。也就是说,对于给定簇中的每个数据点,在给定的半径领域中必须至少包括最少数目的点。这是基于密度聚类方法的主要策略。三种代表性的方法为DBSCAN、OPTICS和DENCLUE。此外,可以将基于密度的方法从整个空间聚类扩展到子空间聚类。文献综述

1.2.7  基于网格的方法

之前讨论的所有算法都是数据驱动的,他们划分对象集并将他们自动适应嵌入空间中的数据分布。另外,基于网格的聚类方法采用空间驱动的方法,把嵌入空间划分成独立于输入对象分布的单元。经典方法有STING聚类和CLIQUE聚类。

对于许多空间数据挖掘问题,使用网格一般都是有效的方法。因此,基于网格的方法一般与其他聚类方法集成使用,比如基于密度的方法和层次的方法

K-means算法WEB文本挖掘中的聚类研究(4):http://www.751com.cn/jisuanji/lunwen_72115.html
------分隔线----------------------------
推荐内容