因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元线性回归。此题中我们使用了多元线性回归模型来建立微博主影响力与各因素的关系模型,并使用残差分析法等来对模型进行改进、优化。用得到的模型对实际的参数进行检验去除那些不合理的数据,并对模型进行进一步优化,使之更加的科学合理反应客观实际模型假设。
(3)问题假设
1、这里面的转发和评论量是在固定的分析微博和统一时段(这里为两周)下统计的,假设数据统计科学合理;
2、建立模型时着重讨论各主要因素忽略次要因素;
3、变量 (i=1,2,3, 7)之间由于各种原因也存在着某种关系,这里不能忽略它们之间的相关分析;
4、假设认证中,0代表未认证,1代表已认证;
(4)符号说明
1、 分别代表认证,关注,粉丝,所发微博数量,分析微博,一定时间微博(两周内)的转发数,评论数。
2、 微博主影响力。
3、Stepwise 表示Matlab统计工具箱中逐步回归命令。R (RMSE)表示剩余标准差,F表示统计量。 , , 分别是 , , 的平均值。
(5)模型的初步建立
将各影响因素认证、关注、粉丝、所发微博数量、分析微博、一定时间微博(两周内)的转发数、评论数排成7列, =[ ],同时微博主影响力y也排成一列,见下表。 用数学方法分析和探索两种典型的网络营销方式(4):http://www.751com.cn/shuxue/lunwen_9161.html