数据分析的类型包括:
1) 探索性数据分析:该方法由美国著名的统计学家约翰•图基命名。该方法就是指为了形成值得做出特定假设的检验而对数据进行分析的一种数据分析方法,是对传统的统计学假设检验手段的一种补充。【9】
2) 定性数据分析:又称为“定性研究”、 “质性研究资料分析“或者“定性资料分析”,是指针对诸如照片、词语、观察结果之类的非数值型数据(或者说资料)做出的分析。【17】
目前数据可视化工具基本以地图、表格、图形等可视化元素为主,数据可进行过滤、数据联动、钻取高亮、跳转等分析手段做出动态分析。
可视化工具可以提供多种多样的数据展现形式,多种多样的图形渲染形式,支持商业逻辑的动态脚本引擎,丰富的人机交互方式等等。
不同于一般的Reporting产品或者Dashboard产品, BI前端是永洪科技的产品,该产品是独具发现型的:分析功能十分强大、交互手段十分丰富。用户可以进一步与数据进行互动、过滤、钻取、刷取、关联、变换等技术,让用户能够:掌握信息,发现问题,找到答案,并采取行动。
1.2.4 数据可视化
将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。【6】
数据可视化已经提出了许多方法,这些方法根据其可视化的原理不同可以划分为基于几何的技术、基于图标的技术、基于层次的技术、基于图像的技术、面向像素的技术和分布式技术等等。【8】
1.3 数据挖掘技术的简介
从数据本身来考虑,通常数据挖掘需要有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示等8个步骤。【20】
(1) 信息收集:根据确定的数据分析对象抽象出在数据分析中所需要的特征信息,然后选择合适的信息收集方法,将收集到的信息存入数据库。【21】
(2) 数据集成:把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。【22】
(3) 数据规约:数据规约技术可以用来得到数据集的规约表示,它小得多,但仍然接近于保持原数据的完整性,并且规约后执行数据挖掘结果与规约前执行结果相同或几乎相同。【23】
(4) 数据清理:在数据库中的数据有一些是不完整的,含噪声的,并且是不一致的,因此需要进行数据清理,将完整、正确、一致的数据信息存入数据仓库中。不然,挖掘的结果会差强人意。【24】
(5) 数据变换:通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。【21】
(6) 数据挖掘过程:根据数据仓库中的数据信息,选择合适的分析工具,应用统计方法、事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法的方法处理信息,得出有用的分析信息。【25】
(7) 模式评估:从商业角度,由行业专家来验证数据挖掘结果的正确性。【26】
(8) 知识表示:将数据挖掘所得到的分析信息以可视化的方式呈现给用户,或作为新的知识存放在知识库中,供其他应用程序使用。【21】
数据挖掘过程是一个反复循环的过程,每一个步骤如果没有达到预期目标,都需要回到前面的步骤,重新调整并执行。【27】
1.4 课题研究的主要内容
物联网、云计算、移动互联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。随着社交网络的普及,使得人们的行为和情绪的细节化测量成为可能。挖掘用户的行为习惯和喜好,凌乱纷繁的数据背后找到更符合用户兴趣和习惯的产品和服务,并对产品和服务进行针对性地调整和优化,这就是大数据的价值。大数据也日益显现出对各个行业的推进力。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。【18】 Gephi+D3.js动态社交网络数据的分析与展示技术(4):http://www.751com.cn/jisuanji/lunwen_14472.html