摘要以最新版《安徽统计年鉴》为研究的主要资料,运用多元统计中的主成分分析方法,对安徽省16个现辖地级市的综合实力进行评估。结果表明,各个城市以南北的地理分布划分,其综合实力存在明显的差异,总的来说,皖南实力最强,皖中次之,皖北较弱。这与经济政策和资源配置及地理位置均有密切的关系。47796
Measuring the 16 municipalities of Anhui comprehensive strength which based on the latest data of Statistical Yearbook of Anhui Province(2014) by using multi-factor principal component analysis. The result shows that: each city’s comprehensive strength is different; there are gaps between the cities which lie in south or north. In short: the south part is the most strongest, the middle part is in the behind, and the north is weak at the comprehensive strength. The reasons are related to economy policies, resource allocation and location on geography closely.
毕业论文关键词: 安徽; 城市综合实力; 主成分分析; SPSS软件
Keyword: Anhui; The comprehensive strength of city; The principal components analysis; SPSS
目录
引言 4
1 主成分分析的概念 4
2 主成分问题求解步骤及解释 5
2.1 相关性检验 6
2.2 求解主成分 6
2.3 主成分选取 6
3 指标的选择 7
4 指标变量的主成分分析过程 7
5 结果分析 14
6 综合评价 15
7 分析结论 16
参考文献 17
致谢 18
引言工业化、城市化和市场化的迅速推进使安徽各城市和地区的竞争日趋激烈,联系日益密切。但是,许多城市并不了解其他城市,不了解自身竞争的地位和环境、优势和劣势。同时,随着安徽经济的发展,城市和区域间发展的差距也在不断扩大,城市竞争力综合评价研究有助于正确评价各城市的现状和潜力,及时了解各城市发展动向及发展趋势,制定完善的城市发展总体规划和战略;有助于各城市之间的相互促进、共同发展;有助于实现经济整体的健康发展。
安徽位于华东地区,经济上属于中国中部经济区,是东部的内陆省份,现辖16个地级市。安徽按地理位置可划分为三个区域:皖北、皖南、皖中。各个区域包含的城市个数不同,其社会经济的总体实力和发展程度也不尽相同。大体来说,皖南的经济较为发达,城市化水平也较高。为了更具体分析各个城市的综合发展水平,笔者选取了16个地级市为研究对象,基于安徽2013年最新出版的统计年鉴,综合选取了有关经济、教育、文化和环境设施等方面的指标,运用多元统计分析中的主成分分析对上述城市的综合实力大小进行区分。因为物质基础决定上层建筑,所以选取指标时还是以经济类为主。
1 主成分分析的概念
主成分分析的目的是降维,从数目众多的原始变量中提取数目较少的综合变量即主成分,要求这些主成分反映原始变量的大部分信息。1933年Hoteling将这个概念推广到随机变量。在多数实际问题中,较多指标间常常存在一定程度的相关性,这就说明观测数据中的信息存在一定程度上的重叠,势必会增加分析问题的难度,因此有必要对变量进行降维,使问题的分析的得以简化。在对某一事物进行实证研究中,为了更全面、准确地反映出事物的特征及其发展规律,人们往往要考虑与其有关系的多个指标,这些指标在多元统计中也称为变量,这就产生了以下问题:一方面人们为了避免遗漏重要的信息而考虑尽可能多的变量,另一方面随着指标的增多增加了问题的复杂性,同时由于各指标均是对同一事物的反应,不可避免地造成信息的大量重叠,这种信息的重叠会谋杀事物的内在规律基于上述问题,人们就希望在定量研究中涉及的变量较少,而得到的信息量又多。主成分分析中的信息,就是指标间数据的差异性,用标准差或方差表示它。因此主成分分析就是考察多个数值变量间相关性的一种多元统计方法,它研究如何通过少数几个主成分来解释多个变量的方差——协方差结构。在多元统计分析中,主成分分析是一种分析、简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。