在1838年为近似二项分布,法国数学家西莫恩•德尼•泊松(Siméon-Denis Poisson)引入了泊松分布,这也是人们首次提到泊松分布的概念[1]。泊松回归正是用来处理因变量服从泊松分布的计数数据的,其首先是作为特例出现在1972年Nelder和Wedderburn提出的广义线性模型中[2]。该模型将因变量期望的一个已知函数与自变量的线性函数联系起来。泊松回归只是其中的一个特例:服从泊松分布的因变量期望值通过对数函数与自变量的线性组合发生关系。由于连接函数为对数函数,所以泊松回归模型又称对数回归模型。27603
泊松回归一经提出便得到了迅速发展和应用。梅长林和王宁在《近代回归分析方法》[3]一书中关于泊松回归的建立,连接函数的选择,参数估计与求解,模型诊断及参数检验给予了比较详细的讨论。在模型建立过程中我们假设因变量独立同分布于泊松分布,选取对数函数作为连接函数又称典则连接函数。根据极大似然估计思想建立极大似然函数,为便于求解通过取对数得到对数似然函数。由于函数的复杂性,参数不便于求得解析解,文章提供了迭代加权最小二乘法,Newton-Raphson迭代法和Fisher法三种方法求解参数数值解。关于假设检验,通过构造卡方统计量(某些正则条件)检验模型拟合优度,构造Wald统计量(某些正则条件)检验自变量显著性。论文网
郭志刚和巫锡炜在《中国人口科学》期刊2006年4期《泊松回归在生育率研究中的应用》一文中将泊松回归应用的生育率研究中[4]。文章详细论述了泊松回归的原理,参数估计,模型及自变量显著性检验,并结合实例通过数据再处理考虑了参数求解,利用泊松回归在人口生育率的应用解释了参数的意义。
广义线性模型自上世纪90年代由部分学者引入到保险定价模型中后,人们根据实际要求基于泊松回归先后发展出了多种回归模型以用来预测保险索赔数目。张连增和吕定海在《广义线性模型在非寿险费率分析中的应用》[5]一文中利用欧洲一家保险公司在1994-1998年车险索赔数据通过泊松回归拟合了保险索赔数目并优于徐听、袁卫和孟生旺在《负二项回归模型的推广及其在分类费率厘定中的应用》[6]中采用负二项回归拟合的结果。
参考文献
[1] 冯予,陈萍。概率论与数理统计[M]。北京:国防工业出版社,2005年
[2] Nelder ,Wedderburn。Generalized Linear Models[J]。J。 R。 Statist。 Soc。 A,1972:370-384
[3] 梅长林,王宁。近代回归分析方法[M]。北京:科学出版社,2012年
[4] 郭志刚,巫锡炜。泊松回归在生育率研究中的应用[J]。中国人口科学,2006(4):1-14
[5] 张连增,吕定海。广义线性模型在非寿险费率分析中的应用[J]。数理统计与管理,2013(5):903-908
[6] 徐听,袁卫,孟生旺。负二项回归模型的推广及其在分类费率厘定中的应用[J]。数理统计与管理,2010(4):656-661
[7] 关治,陆金甫。数值分析基础(第二版)[M]。北京:高等教育出版社,2010年
[8] 褚蕾蕾,陈绥阳,周梦。计算智能的数学基础[M]。北京:科学出版社,2007年
[9] 汪海波,萝莉。SAS统计分析与应用[M]。北京:人民邮电出版社,2013年
[10] Brockman。M。J,Wright。T。S。Statistical motor rating:Mating effective use of your data[J]。Inst。Act,1992(19):457-543
[11] Mack。T。A,Simple parametric model for rating automobile insurance or estimating IBNR claims[J]。ASTIN Bulletin,1991(1):526-597
[12] 李少辅。概率论[M]。北京:科学出版社,2011年
[13] 李玉莉。Matlab函数速查手册[M]。北京:化学工业出版社,2010年 泊松回归文献综述和参考文献:http://www.751com.cn/wenxian/lunwen_22122.html