2 文献综述
3 框架模型和数据处理
3.1 实证方法
3.1.1 方差和协方差原理
方差是概率论和统计方差衡量随机变量或一组数据时离散程度的度量。协方 差是建立在方差分析和回归分析基础上的一种统计分析方法。方差分析是从质量 因子的角度探讨因素不同水平对实验指标影响的差异。一般来说,质量因子是可 以人为控制的。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。 从直观上来看,协方差表示的是两个变量总体误差的期望。如果两个变量的变化 趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期 望值,那么两个变量之间的协方差就是正值;如果两个变量其中一个变量大于自 身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负 值。
3.1.2 方法一 在数据处理中运用了方差和协方差之间的两个公式。 D( X A B C E F )
D( X ) D( A) D(B) D(C) D(E) D(F )
2COV ( A, X ) 2COV (B, X ) 2COV (C, X ) 2COV (E, X ) 2COV (F , X )
2COV ( A, B) 2COV ( A, C ) 2COV ( A, E) 2COV ( A, F ) 2COV (B, C)
2COV (B, E) 2COV (B, F ) 2COV (C, E) 2COV (C, F ) 2COV (E, F )
利用这两个公式对采集的数据进行展开分析。将数据采集之后选取五个国家以美
国、香港、德国、日本、韩国为例。以求美国占比为例,分别求出与美国相关的 五个国家依次求出一倍协方差再算出他们的总和标注为 COV 总和。其次要分别算 出美国的方差标注为 VAR 美国和所有国家的方差标注为 VARALL。最后就可以列
出美国占比公式等于 VAR 美国和 COV 总和相加除以 VARALL。其他五个国家都以 这样的方式求出占比。即公式为
美国占比 (VAR美国 COV全部)/ VARall
3.1.3 方法二
公式二的 D( X ) D( X ) D(Y ) 2COV ( X ,Y ) 展开方式还是以这五个国家为 例总额最多的是美国即公式二中的x等于美国,公式二中的y等于所有国家总额 减去美国,这样求出的x,y即可代入公式二求出一倍的协方差。再求出方差 VAR x和方差 VAR all。即可求出美国占比等于 VAR x 加上 COV(x,y)总和除以 VAR all。 即公式为
x 美国y 所有国家总额- 美国
美国占比 [VARx COV (x, y)]/VARall 下面接着算美国和香港占比、美国香港和德国占比、美国香港德国和日本占
比、以及美国香港德国日本韩国占比。此时的x为依次占比国家y为总额减占比 国家。然后用求美国占比的同样的公式求出依次占比,占比之间的对比看出他们 之间是否存在互补关系从而看出波动性的变化。
3.2 数据采集
数据来源联合国数据库,先下载出九大类高科技关于中国对世界各个国家的 出口数据,时间区间是 1998 年-2014 年再利用 EXCLE 分类汇总出每个国家 1998 年-2014 年的每个年度的总额。这里的九大类为 AEROSPACE、ARMANTMENT、来`自^751论*文-网www.751com.cn
CHEMISTRY、COMPUTER、ELACTRCAL、ELECTRONICS、NON-ELECTRICAL、PHARMACY、
SCIENTIFIC。每一大类然后取出 2014 年度的总额筛选出这一年的中国对其出口
总额最多的五个国家。然后分别求出每一大类的出口额最多的五个国家 1998 年
-2014 年的每年总额。根据时政方法中提出的两个公式还要算出每一大类除去这 五个国家其他国家的 1998 年-2014 年的每年总额以及所有国家的 1998 年-2014 年的总额。以此来计算实证方法中提及的公式一和公式二分解中用到的方差和协 方差。整理出基本数据之后然后再用实证方法中的分解公式依次求其占比以此来 看其波动性影响。