(一)问题定义 15
(二)数据准备 15
(三)数据变换 17
(1) 数据的预处理 17
(2)将数据分类汇总 17
(3)变量值确定方法 18
(四)CART算法的具体应用过程 19
(五)CART算法的不足与改进 20
1. CART算法的不足 20
2. CART算法改进 20
参考文献 21
致谢 21
一、引言
(一)论文的研究背景及意义
随着通信技术的迅猛发展,中国的网络已经发生了翻天覆地的变化,国内的交流平台正面临着一个崭新的,全球化,竞争更加激烈的市场环境。在现如今的商业时代,对于企业一个至关重要的一点就是资源的共享,能掌控客户资源是一个企业生存发展的根源,随之而来的一些问题,例如:如何提高客户满意度、忠诚度,提升客户的价值,扩大其收入利润 都是目前企业关心的重要问题。
所以,企业要想创造更多的价值,就要深层分析企业中拥有大量客户信息的数据库,进而对客户有效管理,充分提取有利于商业运作的有效信息,使企业从“产品”导向向“客户”导向转化。现如今,我们经常提到社会中出现的“数据膨胀但是知识贫乏” 这种现象产生的原因是我们找不到数据中的潜在规则和联系,虽然数据库技术是一种高效查询,数据分析和统计的技术,但如果找不到其中潜在规则和联系,那么就不能很好的预测未来的发展趋势,这种迫切需要解决的问题便孕育而生了数据挖掘这门技术。数据挖掘技术是从庞大的、未知的、不完整的随机数据中找到我们需要的、有用的、含有潜在知识和信息的一个过程,我们正是利用这门新型技术,客户分类问题就迎刃而解。