现在证券市场已经成为人们重要的投资渠道之一,参与股票投资的人数不断增加,而证券投资一直是经济学界中的热点研究话题。无论是价值投资者,还是基本面或技术面投资者,都希望知道下一时刻的股指运行方向。在计算机普遍应用于现代社会生活中时,每天会产生数以百亿兆的金融数据,金融大数据时代的来临加上统计学的相关理论逐步丰富,使得人们可以根据各自不同的目的对数据进行处理和挖掘,以得到想要的东西。金融市场的数据具有明显的时间性,且可以看做是随机游走序列,因而各种时间序列处理方法比如协整检验、VAR模型、ARMA模型、GARCH模型等可以作为其的处理工具。
在此背景下,本文以上海综合指数作为研究对象,以ARMA模型作为工具,研究上海综合指数的走势,并对其下一期的走势进行预测。因而本文的研究深化了时间序列在金融市场的运用,同时相应的研究结果,也可以为投资者操作提供一定的参考作用。另外,了解上海综合指数的运行趋势,可以使政府更加有效掌握股市脉搏,事先明确国民经济运行状况要,从而提高宏观经济政策的制定的质量。
二、ARIMA模型简介
时间序列分析方法由Box-Jenkins(1976年)提出,它适用于各种领域的时间序列分析。ARIMA模型全称为差分自回归移动平均模型,其是由博克思和詹金斯于70年代初提出的一著名时间序列预测方法,即博克思-詹金斯法。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。
ARIMA模型的基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。任何一个时间序列都具有ARIMA(p,d,q)的模型形式。根据所包含成分的不同,时间序列模型可以划分为几种类型,包括自回归(AR)模型、移动平均(MA)模型、自回归移动平均(ARMA)模型等,它们都属于ARIMA(p,d,q)模型的特殊形式。
(一)自回归模型AR(p)
很多经济过程的实现需要若干周期的时间,因此需要在我们的计量经济模型中引入一个时间维,通常的作法是将滞后经济变量引入模型中。其形式如下:
其中 ,i=1,...p是自回归参数, 是白噪声过程。即 的现值与其过去滞后一期或滞后几期的值有关。如果AR(p)特征方程的所有根的模都大于1,即全部根必须在单位圆之外,则称AR(p)具有平稳性。
(二)移动平均模型MA(q)
模型形式如下:
其中 , ,..., 是回归参数。移动平均模型用过去各个时期的随机干扰或预测误差的线性组合来表达当前预测值。如果其特征方程的全部根的模都大于1,则称MA(q)具有可逆性。
(三)自回归移动平均模型ARMA(p,q)
由自回归和移动平均两部分共同构成,表达式为:
其中p,q分别表示自回归和移动平均部分的最大滞后阶数。该模型的平稳性只依赖于其回归部分,即特征方程 的全部根取值在单位圆之外(模大于1)。其可逆性则只依赖于移动平均部分,即特征方程 的根取值应在单位圆之外。
(四)单整的自回归移动平均模型ARIMA(p,d,q)
伯克斯—詹金斯指出经济时间序列常常具有特殊的线性齐次非平稳特性,即参数是线性的, 极其滞后项都是一次幂的)。对于一个非季节性经济时间序列常常可以用含有一个或多个单位根的随机过程模型描述: