在一些较为落后的城市,政府为了带动经济的发展,经常会采用招商引资的方法引来许多外资企业的投资者前来发展经济.但是这其中不乏许多不重视环境保护的投资商,只是一的谋取利益,而资金不是很充足,污染治理设施并不是很完善、应付检查、肆意排污.改革开放以来,中国经济发展速度飞快,但是,生态环境也为此付出了巨大的代价.GDP平均以每年增长9.0%的速度,使经济得到了高速发展,但同时也消耗过多的原材料.在工业化快速发展的过程中排放的废水、废气及固体废弃物,严重影响了人们的生存环境和生活水平,近几年癌症村、雾霾的出现更加让我们深思.
我国是世界上的发展中国家,人口基数大、人均资源不足、各地区经济发展极不平衡.我过经济的增长速度之快举世瞩目,但经济快速增长带来的资源过度消耗,环境污染严重导致的自然灾害频发不良后果等等不仅制约着经济增长还影响人民的生活水平.可持续发展已经成为我国发展的战略道路.目前,经济发展与环境污染有著名的环境库兹涅茨假说(EKC).环境库兹涅茨曲线的含义是:沿着一个国家或地区的发展轨迹, 尤其是在工业化的起飞阶段, 不可避免地会出现一定程度的环境恶化;在人均收入达到一定水平后, 经济发展会有利于环境质量的改善[1].
2 原理2.1聚类分析的方法理论
聚类分析给人们提供了丰富多彩的分类方法,这些方法大致可归纳为:系统
聚类法、模糊聚类法、K-均值发、分类聚类发和加入聚类法.
用 表示类,设 中有 个元素,这些元素用 , 等表示.
定义 为一个给定的阀值,如果对任意的 ,有 ( 为 和 的距离),则称 为一个类.
现在类 的元素用 表示, 为 内的样品数(或指标数),可从不同的角度来刻画 的特征,常用的特征有下面三种.
(1)均值 (或称为 的重心) (2-1)
(2)样本离差阵及协方差阵
(3) 的直径
在聚类分析中,不仅要考虑各个类的特征,而且要计算类与类之间的距离.由于类的形状是多种多样的,所以类与类之间的距离也有多种方法.令 和 中分别有 个和 个样品,它们的重心分别为 和 ,它们之间的距离用 表示.
(1)最短距离法 (2-6)
它等于类与中最邻近的两个样品的距离.
(2)最长距离法 (2-7)
它等于类与类中最远的两个样品的距离.
(3)类平均法它等于类 和 中任意两个样品距离的平均,式子中的 和 分别为类 和 类中的样品数[2].
2.2典型相关分析的基本理论及方法
典型相关分析研究两组变量间整体的线性相关关系,它是将每一组变量最为一个整体来研究,而不是分析每一组变量内部的各个变量.所研究的两组变量可以是一组变量为自变量,而另一组为因变量的情况,两组变量也可以处于同等地位,但是典型相关分析要求两组变量都至少是间隔尺度的.
设随机向量 ,x和y的协方差矩阵为:
Cov (2-9)
不失一般性,设p<q, 是pxp阶矩阵,他是第一组变量的协方差阵; 是qxq阶矩阵,他是第二组变量的协方差阵.并且当 时正定的时候, 和 也是正定的.
我们将x和y进行线性组合,为了研究他们之间的关系,有
式子中 , ,是任意非零常熟向量.我们希望在x,y及∑给定的条件下,选取a,b使得 之间的相关系数: