原则上讲,数据挖掘在任何类型的信息存储上都可以进行。这其中包含关系数据库、数据仓库、事务数据库、文本数据库、网络、空间数据库、时间序列数据库、多媒体数据库、面向对象的数据库、对象-关系数据库等。下文对几个重要的数据挖掘对象进行介绍。
1) 关系数据库
数据挖掘用于关系数据库时,可用于探索趋势及关系模式。关系数据库具有坚实的数据基础、完整的规范化理论、统一的组织结构、一体化的查询语言等优点,是当前数据挖掘最重要、最流行、信息最丰富的数据源,是人们对数据挖掘研究的最主要的数据形式。源.自/751·论\文'网·www.751com.cn/
2) 数据仓库
数据仓库技术是数据库技术的发展,它是集成的、面向主题的、内容相对稳定的、随时间变化的数据集合,可用以支持管理决策的制定过程。各种应用系统、多种数据库被数据仓库系统集成起来,为统一的历史数据分析提供了坚实平台。
数据挖掘需要良好的数据组织和“纯净”的数据。数据的规范性直接影响了数据挖掘的效果,而数据仓库从各类不同的数据源中提取数据,再经过清洗、集成、选择、转换等处理过程,为数据挖掘所需要的高品质数据提供保证。事实上,数据挖掘给数据仓库提供了有效的分析处理方法,反过来,数据仓库同时给数据挖掘准备了高品质的数据源。