在许多实际问题中,影响因变量的因素往往是多个的,这种一个因变量同多个自变量的回归问题就是多元回归,当因变量与各自变量之间为线性关系时,称为多元线性回归.
设因变量为 , 个自变量分别为 ,描述因变量 如何依赖于自变量 和误差项 发生变化的方程称为多元回归模型.其一般形式如下:
式中, 是模型的参数, 为误差项.该模型应该满足的两个前提条件是:
回归方程中的 是根据最小二乘法求得,即使残差平方和 最小[4,5].
2.2 多元线性回归的相关系数
线性回归在日常生活中得到了广泛的应用.在进行线性回归时首先要判断自变量与因变量之间是否存在线性关系,若有相关关系就再进行线性回归分析.判别相关关系的方法主要有两种,一是绘制散点图观察图像进行判别,二就是通过量化的判别方法即我们所说的相关系数.
在统计学中我们经常用相关系数r来对两个变量之间相关性的强弱进行检验.
相关系数可以用以下公式来计算:
说明:1.注意r的正负号.当r大于0时自变量与因变量之间存在正相关,当其小于0时自变量与因变量之间存在负相关源^自·751{文\论[文'网]www.751com.cn,当它等于0时自变量与因变量之间不存在线性关系.
2.r的大小.当r的绝对值大于0.75小于1的时候自变量和因变量的相关性很强.当r的绝对值大于0.3小于0.75的时候变量的相关性一般.
2.3 多元线性回归的显著性检验
线性回归方程能够反映自变量与因变量之间关系的前提是:自变量与因变量之间存在显著的线性关系.回归方程的显著性检验就是要检验自变量与因变量之间是否存在显著的线性关系.回归方程显著性检验的基本出发点与相关系数的检验相似.我们知道 .回归方程的显著性检验正是采用方差分析的方法,我们所要研究的就是 相对于 在 中是否占有较大的比例.如果占有比例较大则说明自变量和因变量的线性关系是显著的,所建立的线性模型能够很好的反映两个变量的相关关系.反之,如果占有的比例较小则说明自变量和因变量的全体线性关系不明显,所建立的线性模型是不恰当的.