数据挖掘技术在个人信用评估模型中的应用 第3页
能就会解决越多的商业问题。而且使用多种不同的挖掘技巧可以对挖掘结果的质量进行检测。例如,在构建信用计分模型时,分类可以通过三种方法来实现:决策树,神经分类和逻辑回归,每一种方法都可能产生出不同的结果。如果多个不同方法生成的结果都相近或相同,那么挖掘结果是很稳定、可用度非常高的。如果得到的结果不同,在使用结果制定决策前必须查证问题所在。
(5) 模型确定:数据挖掘之后,形成计分卡的数学模型。
(6) 模型检验:用另外一组数据对模型进行验证,如果吻合程度比较高,表明该模型比较真实可靠,反映了实际业务情况,可以投入应用。否则需要重新进行数据收集和挖掘。
(7) 模型应用:可以根据确定的计分卡模型实现应用并反馈到银行的业务操作系统,指导银行业务操作。
(8) 模型调整:由于模型产生的数据基础是以前一段时间的数据,在经过一定时间运行后,必然会发生某些偏颇,甚至不能反映业务实际情况。因此需要定期对模型进行调整,一般情况下是半年一调。调整的过程基本上和建设模型一样,需要经过收集数据、数据挖掘、模型确定、检验、应用等过程。
4.3 新型评分系统的构建
个人信用评分系统的构建过程是一个采用数据挖掘技术在大规模的数据中建立模型和发现数据间关系的过程,并将这些模型和关系用来做出预测和决策。为保证开发过程规范、可靠有效、易于管理,个人信用评分系统的开发过程以数据挖掘跨行业标准过程(CRISP-DM)为参考框架。数据挖掘跨行业标准过程(CRISP-DM)是公认的、较有影响的数据挖掘过程模型之一。CRISP-DM 强调,数据挖掘项目的开发过程不单是数据的组织或者呈现,也不仅是数据分析和统计建模,而是一个从理解业务需求、寻求解决方案到接受实践检验的完整过程。根据CRISP-DM的过程模型, 数据挖掘项目的开发过程包括以下辣个相互联系的环节:理解业务目标(Business Understanding),理解数据(Data Understanding),准备数据(Data Preparation),建立模型(Modeling),验证模型(Evaluation)和模型实施(Deployment)。
(1) 理解业务目标
个人信用评分系统旨在量化个人客户信用风险,也就是评估个人客户产生拖欠 帐户的可能性,从而为信用政策的制定提供量化支持。个人信用评分系统建设的核心问题是开发信用评分模型。申请评分模型和行为评分模型的相同点在于:两者都是为了预测信用风险而建立的,“好”“坏” 帐户的定义一致,模型输出都采用 帐户是“好”或“坏”的概率进行测度,使用的基本数据分析方法相同;申请评分模型与行为评分模型的不同点在于,二者应用的业务环节不同,需要观察的数据不同,计算评分的次数不同等。
(2) 理解数据
这个阶段要搜集与信用评分有关的内部和外部数据,在此基础上进行数据质量问题的评估。这一阶段的主要任务包括:确定信用评分模型所需要的数据、评估数据质量、定义时间窗口、定义观察变量、定义表现变量
(3) 准备数据
数据准备阶段包括从原始数据构成最终用于挖掘的数据子集所进行的活动。数据准备的工作可能需要进行多次,这一阶段的主要任务包括:数据提取和抽样、数据清理加工、构建派生变量、数据分割。
(4) 建立模型
经过数据准备,取得完备的基础数据之后,就可以选择适当的数理统计分析技术,对数据进行分析,建立所需要的评分模型。由于建立模型过程中对数据的要求不断调整,因此经常需要返回到数据准备阶段对数据进行相应的处理。
建立申请评分模型和行为评分模型的基本数据分析步骤是类似的。信用评分模型可以采用逻辑回归分析、决策树、神经网络分析等多种数理统计模型技术,可以根据数据情况、数理统计模型的适应性和准确性、人员的知识结构等因素挑选相应的数理统计模型技术,建立信用评分模型。
(5) 验证模型
模型建立之后,需要对模型结果进行评估。利用如下的评分模型评估公式,进行分离度(用D表示,Divergence)检验,验证模型的质量。
分离度的值越大,好帐户均值与坏帐户均值之间的差距越大,表明模型能够更好地区别好帐户与坏帐户。
根据模型验证的结果确定模型是否符合项目预计目标的要求,符合则发布模型进行实施使用,否则对模型的开发过程作进一步的调整,优化和改进模型直至达到项目目标要求。
(6) 模型实施
信用评分模型经过验证之后,一般需要以在线和自动化的形式交付使用,如在个人信贷业务中,个人信用评分系统的结果需要提供给个人信贷系统、信用策略管理系统。因此模型实施阶段,需要将已经验证好的评分模型,进行系统设计、编码、测试、部署和文护。
拓展和提升个人信用评分系统的应用与探求个人信用评分系统的开发技术同样重要。个人信用评分系统为信用政策的制定、分析、评估、优化提供量化支持,可以应用于业务审批、产品定价、信用额度管理、催收清收、欺诈检测、客户服务和市场营销等业务环节中,其应用也从早期支持信用申请审批的自动化,降低信用风险损失,逐步发展到跟踪分析客户生命周期价值,支持信用政策持续优化的新阶段。
以个人信贷系统为例,个人信用评分系统的应用既是一个系统集成的过程;同时也是一个业务流程和信用政策持续优化的过程。个人信用评分系统需要与个人信贷系统、信用策略管理系统进行集成,其中个人信贷系统负责个人信贷业务流程与帐户的管理;个人信用评分系统提供个人信用风险的定量评分;信用策略管理系统负责各种信用政策的参数化设置,如审批界限分的设置、额度设置、催收策略设置等,定期产生各种分析报告,测试评估各种信用政策的效果,为持续跟踪优化信贷业务流程和信用政策提供技术支持。
5 数据挖掘技术的发展
数据挖掘是一个新兴的多学科交叉领域、是数据库系统最重要的前沿研究领域之一,也是信息工业中最富有前景的数据库应用领域之一。随着信息数量的快速增长,数据挖掘技术也研究也日益深化。其中,对大规模数据库内容进行高效的数据挖掘,已作为数据挖掘研究的基本出发点,为我们提出许多尚待解决的问题,主要涉及数据挖掘的方法、用户交互、性能与可扩展性,以及多样化数据的处理等。
参考文献:毕业论文
http://www.751com.cn[1]朱明.数据挖掘.中国科学技术大学出版社,2002.
[2] 华桦,刘会治.量化个人信用程度.中国计算机报2005(50).
[3] 林志刚.银本文来自辣文论文网.南方金融2005(5).
[4]吴德胜,梁操,杨力.不同模型在信用评价中的比较研究[J].预测,2004,23(2):73—76.
[5]Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].机械工业出版社,2005.
[6]托马斯,埃德尔曼,克鲁克.信用评分及其应用[M].中国金融出版,2006.
上一页 [1] [2] [3]
数据挖掘技术在个人信用评估模型中的应用 第3页下载如图片无法显示或论文不完整,请联系qq752018766