面向B2C平台的潜在客户识别研究(3)

理论意义：
数据挖掘是近年来兴起的一门新兴交叉学科，融合了机器学习、人工智能、数据库等多门学科，旨在发掘潜在有用信息以用于决策支持。相对于国外比较超前的数据挖掘研究，国内的研究还有着较大的发展空间，尤其是在B2C平台应用方面更显不足。面对国外研究已远远超越国内研究的状况，本毕业设计在对B2C平台进行研究的基础下，结合焦点公司新一站保险网的实际情况，致力于解决B2C平台潜在客户识别中面临的难题，希望本文的研究对数据挖掘在现实具体行业中的应用有一定的推动作用。
实践意义：
现在B2C平台对于记录的客户基本信息、交易记录以及客户反馈等海量数据的利用率还很低，基本停留在检索查询和兴趣推荐等基础阶段，还未将这些信息与客户识别结合起来。发挥这些信息的作用对于客户识别有着重要的意义：
其一，帮助企业更加深入、准确的把握客户特征，制定相应营销策略。电子商务中客户需求是多样化的，客户细分对于B2C企业而言是必不可少的。而数据挖掘以客户的海量特征数据和交易数据为支撑，通过具体模型或算法的运算，对不同购买兴趣、购买频率、浏览偏好的客户进行细分。此时，企业可通过优化的细分结果，制定差异化的营销策略，满足客户个性化需求，提高客户满意度，使其从浏览者转变成企业客户。
其二，提高企业经营效益。在现有的客户挖掘中，客户分类有助于B2C企业分清盈利型客户、非盈利客户与亏损型客户，文护盈利型客户为企业带来收益同时避免非盈利客户甚至亏损型客户能为企业带来利润的同时减少不必要的损失与风险；而在未来潜在客户的挖掘中，它又能为辨别网站访问者是否为潜在客户提供决策支持。
1.3 研究内容与思路
本文针对B2C电子商务平台发展的客户挖掘的需要，提出了潜在客户识别这一研究主题。客户识别首要任务便是客户分类，客户分类不等同于数据挖掘中的分类方法，数据挖掘中的分类方法只是客户分类方法的一种，聚类也是常见的客户分类方法。Taeho Hong和Eunmi Kim就提出了先用SOM（自组织映射）与k-means聚类，再用k-最邻近的方法细分客户[15]。然而，聚类方法在有新成员加入时，聚类中心很可能发生变化，聚类结果也可能发生较大变化，造成时间、精力上的重复与浪费。因此，本文采用的是数据挖掘中分类的方法。
首先从数据挖掘定义、数据挖掘流程、数据挖掘所能实现的功能及数据挖掘中分类的常用方法等方面介绍了数据挖掘的相关理论基础。。
在理论介绍的基础上，分析B2C自身的属性和B2C客户区别于传统商务客户的特点。根据B2C平台的数据特征，提出web数据挖掘的方法。设计潜在客户识别理论研究模型，结合焦点科技公司的“新一站保险网”的浏览日志数据进行实证分析研究，具体包括以下部分：
①抓取网站用户浏览日志，建立初始用户行为数据库；
②针对所抓取的用户行为数据，进行数据预处理，将客户行为用各项属性的方式进行描述。通过数据清理、用户行为属性选择、离散化后，得到适合数据挖掘的客户属性数据。
③选择部分预处理后的用户数据作训练数据集，分别用决策树、神经网络两种方法挖掘分类规则，建立分类器；其次，用测试数据集分别对两种分类方式发现的模型进行检测，比较分析两种方法的分类准确性。
1.4 论文结构
第一章：介绍了本文研究主题的研究背景，包括B2C电子商务、潜在客户挖掘的显示需求、研究意义、研究内容及思路与论文的总体结构。面向B2C平台的潜在客户识别研究(3):http://www.751com.cn/jisuanji/lunwen_21372.html