1.2论文的主要内容和研究方法:本文在介绍了河南8个较发达城市的各方面综合发展的基础上,构建了数学模型,运用描述性统计和层次分析的方法,形象直观得对主要城市进行了比较分析。通过综合评价,分析了河南省各主要城市综合发展的优劣,给出了改善各城市综合实力的对策建议。在对数据分析的时候,一般首先要对数据进行初步分析,即描述性统计分析(Descriptive Analysis),以便发现其内在的规律,清楚明了直观得看出数据存在的规律性和差异性,再选择进一步分析的方法。描述性统计就是对调查总体的所有有关的变量的相关数据做初步的统计性的描述,主要包括数据的频数分析、数据的集中趋势分析、数据的离散程度分析、数据的分布、以及根据数据绘制一些基本的统计图形例如条形统计图,折线统计图,扇形统计图等。而层次分析是把一个既复杂且目标又多的决策问题作为一个系统,将目标进行分解,分解成多个目标或者准则。进而分解成多个指标(或准则、约束)的若干个层次,通过定性指标模糊量化方法算出层次单排序(权数)和总排序,以此作为目标(多指标)、多方案优化决策的系统方法。我们构造影响因素之间的成对比矩阵,获取重要度,并进行一致性检验。我们可以通过这两种模型得出河南省主要城市的综合实力排名,同时可以对比这两个模型,以求结果的清晰性,直观性,准确性。
第2章 综合实力的数据初步分析
2.1 描述性统计的理论知识
我们先通过描述性统计的方法对数据进行初步的分析。在对数据进行初步描述时,我们通常用以下的几种分析方法。数据的集中趋势分析:是用来反映数据的一般水平,经常用的反映指标有平均数、中位数和众数等。各指标的具体意义如下: 平均值:是反映数据的整体均值中心的位置的重要指标,可以体现一些数据的必然性的特点,其中包括几何平均值、算术平均值、调和平均值和、加权算术平均值。 中位数:是另外的一种可以反映所有数据的排布的中间的指标,它的确定方法是把所有的数据按照从小到大的顺序排列,处于最中间的数据的值就是中位数。 众数:是指在所有数据中出现频率最高的数值。 若各个数据之间的差异的程度较小,用平均值就能有比较好的代表性;但是如果数据之间的差异程度比较大,特别是存在个别的极端值的情况,那么用中位数或者众数就有比较好的代表性。数据的分布:在我们通常所做得统计分析中,一般要假设样本的分布是属于正态分布,所以我们需要采用偏度和峰度两个指标,通过这两个指标来检查样本是不是符合正态分布。偏度用来衡量的是样本分布的偏斜方向和分布的程度;而峰度衡量的是样本分布的曲线的尖峰程度。通常情况下,若样本的偏度特别接近于0,而峰度比较接近于3,那么我们就可以判断为总体的分布接近正态分布。数据的离散程度分析:数据的离散程度分析主要是用来反映数据之间的相互的差异的程度,通常用的指标有两个,方差和标准差。这两个指标的关系是,方差的平方根就是标准差。对于不同的数据类型,一般采用不同的计算方法。 绘制统计图:用图形来表示数据,比用文字表达更清晰、更直观、更简明。一般用SPSS软件或者excel软件,可以很容易的绘制出各个变量的统计图形,这些图形包括条形图、饼图、扇形图和折线图等。
在分析这八个城市的综合经济实力的问题上,我们先运用描述性统计里的绘制条形图的方法,以便于我们更加直观更加明了得发现各个城市在我们选取的六个方面的差异性。