菜单
  
    摘  要:近来互联网快速发展,使人们进入了大数据时代.大数据时代的一个主要特征是数据增长的速度越来越快,人们需要做的是思考哪些数据是有价值的,并且知道如何利用这些数据.由于数据挖掘技术的方法很多,并且每一种方法都有自己的独到之处,那么对于数据挖掘方法的选择并不是一成不变的,很多方法之间都是相互联系、相互补充的.本文介绍了数据挖掘常用的方法,对每一种方法的优势和不足之处做了总结,并介绍了数据挖掘技术用到的领域.通过对数据挖掘的探究,使人们对数据挖掘有更清晰的认识,重视数据挖掘技术所带来的价值.31183
    毕业论文关键词:数据挖掘;聚类;神经网络;决策树
    Commonly Used Methods of Data Mining
    Abstract: Recent rapid development of the Internet, so that people entered the era of big data. A key feature of the era of big data is the data growing faster and faster, people need to do is to ponder what data is valuable, and know how to use these data. Since the method of data mining technology a lot and each has its own unique, so the choice of data mining is not static, are interrelated among many ways complementary. This article describes the data mining common approach , each approach 's strengths and weaknesses summarized and presented in the field of data mining techniques used by data mining exploration , data mining so that people have a clearer understanding , attention data mining technology brings value.
    Keywords: Data mining; Clustering; Neural network; the decision tree
    目    录

    摘 要    1
    引言    2
    1. 数据挖掘概述    3
    1.1数据挖掘的定义    3
    1.2数据挖掘常用的方法    3
    1.2.1分类    4
    1.2.1.1决策树    5
    1.2.1.2 KNN法(K-Nearest Neighbor)    6
    1.2.1.3朴素贝叶斯分类    7
    1.2.1.4人工神经网络    8
    1.2.2聚类    10
    1.2.2.1算法分类    10
    1.2.2.2常用的算法    11
    1.2.3回归分析    12
    1.2.4关联规则    14
    2数据挖掘的应用    17
    2.1数据挖掘在医学上的应用    17
    2.2数据挖掘技术在金融领域的应用    18
    2.3数据挖掘技术在电子商务中的应用    19
    3数据挖掘技术所面临的挑战    20
    4结束语    21
    参考文献    22
    致谢    23
    浅谈数据挖掘的常用方法
    引言
         随着互联网的发展,人们每时每刻都在创造者大量的信息,交易信息、消费信息、社会信息等等,这些数据包括结构化和非结构化,整体是一个很复杂的数据集,我们不知道哪些信息是有用的,哪些是无价值的,能做的就是想尽办法把这些信息存储起来,说不清楚有多少存储在全世界有多少未被使用的信息存储在世界各地.计算计存储数据的速度很快将超过人们使用信息的能力.如果我们能够找到数据中隐含的规律或者有价值的信息,那这些巨大的数据就能为人们创造价值,而不是积累在数据库中.因此,需要不断的探究数据中隐含的规律或者有价值的信息.数据挖掘技术的定义与另一个术语“知识发现”(KDD)联系紧密,区别和联系并存.有观点认为,KDD可以被看成是数据挖掘技术的一个特殊方式.但是数据挖掘不仅仅是数据发现,它还包含数据的去噪、计算、建模等步骤.这就是数据挖掘技术.
    对于数据挖掘的研究,国外要先进很多,并建立了很多相关的数据挖掘工具,如R语言、SAS、SPSS、Matlab等等.和国外比较,中国对这一块的重视近年来才开始,整体上还出于初始阶段,并且做这些工作的人主要是科研机构,高校等.那么对数据挖掘的实际应用更是很少,如今我们可以看到互联网上都在说大数据,但实际上很多公司都没有实际的去尝试,并没有把数据挖掘技术当作决策的一种有效手段.不过幸运的是国内很多大型企业已经注意到数据挖掘的价值,都开始投入巨资研究,如百度投资3亿美元在硅谷设立研发中心,专门从事数据挖掘的应用研究.阿里、京东都在招聘数据挖掘科学家等等.这说明企业都开始认识到数据的力量,这是一个很好的开始.
  1. 上一篇:多元函数条件极值的计算及其应用
  2. 下一篇:GDP增长和股市收益率的相关性研究
  1. 椭圆的生成路径研究

  2. 基于指数模型的最大次序统计量的可靠性性质

  3. 关于运用韦达定理时出现问题的探讨

  4. 学讲计划数学课堂中合作...

  5. 行列式在高中数学中的应用

  6. 多项式拟合在变形数据分析中的应用

  7. 非线性差分方程解的单调性

  8. 杂拟谷盗体内共生菌沃尔...

  9. 中考体育项目与体育教学合理结合的研究

  10. 十二层带中心支撑钢结构...

  11. 乳业同业并购式全产业链...

  12. 河岸冲刷和泥沙淤积的监测国内外研究现状

  13. 大众媒体对公共政策制定的影响

  14. 电站锅炉暖风器设计任务书

  15. 酸性水汽提装置总汽提塔设计+CAD图纸

  16. 当代大学生慈善意识研究+文献综述

  17. java+mysql车辆管理系统的设计+源代码

  

About

751论文网手机版...

主页:http://www.751com.cn

关闭返回