由于系统中存在不少异常的交易数据,很难及时地发现有效数据,这降低了债券估值的有效性和实时性,同时用于估值的数据的使用还处于人为判断的形式。因此降低人为因素对于债券收益率曲线准确性的影响、缩短市场和债券收益率曲线发布的之间的响应时间成了现在债券实时估值需要解决的问题。
1.3 本文的主要内容
本文先介绍中国债券估值的发展和国内外发展的现状,然后针对目前债券估值缺乏实时性、过度依赖人力这两大问题进行分析。根据上述两个问题,本文提出一个观点:利用SparkR来提升债券估值的性能。SparkR是Spark和R的结合,它既具有Spark的特性能提高原先算法执行的速度、还具有R那样较强的统计计算分析能力。更重要的一点是,它能将计算结果用图表这样可视化的形式展现出来。大数据的挖掘和处理需要并行计算作为平台,而SparkR可以满足这个需求。
本文将设计基于SparkR的债券估值系统,用分布式并行计算来提升计算速度,采用统计计算来选取有效的债券数据。
1.4 本文的篇章结构
第一章为引言,介绍债券估值的背景和意义,收益率曲线的研究现状,估值存在的问题和改进的方向。
第二章介绍构债券实时估值的核心技术:样条函数基础知识,R语言简单介绍,Spark的运行特点。
第三章介绍债券实时估值系统需求分析,对估值系统的功能和流程进行阐述分析。整个系统分成三大模块,即债券估值信息维护、收益率曲线管理和债券估值系统。
第四章介绍债券实时系统设计与实现
第五章,对全文进行总结和对未来的展望。
2 债券实时估值核心技术
债券估值涉及到许多技术,本章将对三大核心技术进行介绍:样条函数、R语言和Spark分布式并行计算框架。
2.1 样条函数的理论基础
在电脑被使用之前,数值计算都由手工完成。如多项式阶跃函数这样的函数被广泛使用。随着计算机的出现,样条函数逐渐取代了多项式插值,凭借光滑灵活的形状在计算机图形学中受到青睐。“样条”一词最初是指弹性的细木条或金属板条,被绘图人员用于画曲线,在工程学术语中被称为“放样”。
在数学中,样条函数是分段函数,它平滑程度高,且分段衔接点也具有光滑性。在插值问题中,样条插值通常优于多项式插值,因为它会产生的结果与高阶多项式插值的效果类似,同时避免龙格现象的不稳定性。在计算机图形学中,参数曲线的坐标通常由样条函数生成,因为它们构成简单751;文'论"文;网www.751com.cn,使用方便、拟合精准,并且具有近似曲线拟合和交互式曲线设计中复杂形状的能力。
样条函数分为两类:规则样条函数和张力样条函数。规则样条函数是选取可能位于样本范围外的数据来建立渐变的平滑表面。张力样条函数根据建模的特性控制曲面平滑的程度,它受样本范围的严格约束,因此表面相对不太平滑。
数学定义如下:假定节点为 个点 满足 ,给定整数 。在节点 的k样条函数S(x)满足:
在每个区间 ,S(x)是不超过k的多项式。
在整个区间 ,S(x)具有(k-1)次连续导数。
因此,S(x)k次分段多项式,整体具有(k-1)次连续导数。