菜单
  
    连通性分析 16

    3 核心算法 17

    3.1 K-means 聚类算法 17

    3.2 奇异值分解 18

    3.2.1 传统 QR 迭代算法 18

    3.2.2 基于双边 Jacobi 旋转的 SVD 算法 22

    3.2.3 基于单边 Jacobi 旋转的 SVD 算法 24

    4 实验分析 24

    4.1 实验数据的获取与提取 25

    4.1.1 数据的获取与分组 25

    4.1.2 文本向量的提取 27

    4.2 实验过程 28

    4.3 实验结果与分析 28

    4.4 算法对比分析 33

    4.4.1 K-means 算法 33

    4.4.2 主成分分析 33

    4.4.3 今后的工作 34

    35

    36

    参 考 文 献 37

    1 绪论

    在近几十年的计算机的发展历程中,人类利用计算机信息技术来收集数据的 能力正在以飞快的速度增长着,许许多多的数据库系统用于各行各业中,包括学 校、工地、商品管理、科研开发等等,人们被铺天盖地的信息资源所淹没,同时, 伴随着“大数据”时代的到来,这就非常迫切地需要人们对海量的数据进行统筹 管理,传统的数据库方法可以对数据进行统计、查询和管理,但是难以发现数据 之间的内在联系,因此提出了数据挖掘作为解决这个问题的重要方法,而聚类分 析则是数据挖掘中一项主要的技术。

    1.1 聚类分析

    1.1.1 聚类分析简介

    聚类分析是一种将一个集合内的对象聚集为多个不同聚类,使得同一组中的 对象相比于其它群体有着更为密切或相似的关系[16]。聚类分析是搜索性数据挖 掘的一个主要工作,是一个对数据进行统计分析的常用的技术,在许多领域上使 用,包括机器学习、模式识别、图像分析、信息检索、生物信息学等。

    聚类分析本身不是一个具体的算法,而是一个一般要解决的任务。它可以通 过各种算法和显著不同的构成集群的概念,从而有效的找到这些集群。集群主要 的概念包括了集群成员之间的较小的距离组、数据空间的密集区、间隔或特定的 统计分布。聚类分析可以归结为一个多目标的优化问题,合适的聚类算法和参数 设置取决于个人的数据集合结果的预期。聚类分析不是一个自动的任务,而是一 个在知识发现和交互式多目标优化涉及的尝试和失败的迭代过程。它往往是必要 的修改数据的预处理和必要的模型参数,直到达到所需的性能。

  1. 上一篇:生物信息云平台上的微生物群落拓扑分析
  2. 下一篇:游戏平台中行为规则抽取研究
  1. 基于MATLAB的图像增强算法设计

  2. jsp+sqlserver高校二手商品交...

  3. 基于Kinect的手势跟踪与识别算法设计

  4. JAVA基于安卓平台的医疗护工管理系统设计

  5. java+mysql设备监控记录的大...

  6. 基于核独立元分析的非线...

  7. 基于Hadoop的制造过程大数据存储平台构建

  8. 杂拟谷盗体内共生菌沃尔...

  9. 十二层带中心支撑钢结构...

  10. java+mysql车辆管理系统的设计+源代码

  11. 大众媒体对公共政策制定的影响

  12. 酸性水汽提装置总汽提塔设计+CAD图纸

  13. 乳业同业并购式全产业链...

  14. 电站锅炉暖风器设计任务书

  15. 河岸冲刷和泥沙淤积的监测国内外研究现状

  16. 中考体育项目与体育教学合理结合的研究

  17. 当代大学生慈善意识研究+文献综述

  

About

751论文网手机版...

主页:http://www.751com.cn

关闭返回