3.2数据来源及数据处理 3
4研究方法 4
4.1 典型地物的光谱特征分析 4
4.2决策树的建立及分类 6
5结果与分析 7
6结论与展望 8
参考文献 9
致谢 10
1绪论
遥感技术是一种以电磁波为理论依据,利用各种传感仪器进行收集、处理远距离目标所反射或者辐射的电磁波信息,并最终形成遥感影像,从而对地物类型进行探测和识别的综合性技术。因其获取资料的速度快、更新的周期短,受地面条件限制少,探测范围大等优点,已经发展成为近些年最受重视的科学技术之一。
在遥感技术的发展过程中,依据遥感影像对各种目标地物进行识别和分类是进行遥感图像判读和解译的主要手段之一,主要方法是通过对遥感影像中不同地物所表现出来的不同的几何、空间、纹理、光谱等信息的分析,按照某种算法或者规则将其划分为不同的类别。但是,在遥感影像中并不一定都是异物异谱的,往往也会有“同物异谱”或“同谱异物”现象的存在,尤其在过于破碎和复杂的地形和地物情况下,对于复杂的多维时相的处理时,用传统的方式进行统计和分类很难满足精度的要求,这在一定程度上就会造成一些不可避免的混淆和错误,效果不甚理想。因此就需要不断地探索新的分类方法。在20世纪末,数据挖掘技术逐渐兴起,决策树算法也因其强有力的决策系统而成为了运用比较广泛的归纳推理算法。决策树分类方法具有清晰、准确、直观、高效、灵活等特性论文网,特别是在处理多维数据时!751·文~论^文'网www.751com.cn,其获取的直观且易理解的知识,更容易被人接受。很多领域都已经应用到决策树分类方法,如天文学、医学、分子生物学、制造和生产以及遥感影像分类等诸多领域。
目前,决策树分类的算法有很多。1986年,机器学习研究者J.Ross 昆兰开发了决策树算法(又称作ID3算法),在国际上引起了很大的反响;他又于1993年在他自己的一本书中补充和改进了ID3算法,提出了后来流行的C4.5算法;后来,昆兰又在C4.5的基础之上引入了Boosting技术,因而出现了C4.5的商业改进版—C5.0算法,在数据量庞大情况下的效率与生成规则的数量以及正确性方面有了明显的提升。但因为作商业用途,昆兰并没有对C5.0算法的数学描述以及步骤进行公布。国内在遥感分类方面应用决策树分类方法的也有很多。2003年,南京大学的赵萍等在SPOT卫星影像居民地信息的自动提取中应用了决策树算法;2006年,南京林业大学的陈鑫等探讨了6种不同的决策树算法;2009年,中国地质大学的李琳等,在SPOT5影像分类时,将SVM和决策树算法有效地结合在一起,Kappa系数达到了0.9531。
2决策树分类方法概述
2.1决策树的定义及其分类原理
决策树,简单来说,就是一个外观看起来像流程图一样的树型结构。一个决策树的组成大致分为四个部分:首先是一个位于树的最高点的根节点(这也是整个决策树的开始)和一系列内部节点,然后是分支以及若干个叶节点。在每一个内部节点中,只存在一个父节点以及至少两个子节点,分支则是在节点及其子节点之间形成。一个决策过程中所需测试的属性由树的每个内部节点表示,而测试的结果则是由分支来表示。如图1,是二叉决策分类器在遥感影像中应用的简单示意图,从中我们可以非常直观、清楚地看到决策树的几个基本组成部分。