摘 要:本文将传统的统计模式识别理论和遗传算法的优势结合起来,提出一种基于遗传算法的聚类分析算法。该算法以若干个二文平面上的点为遗传算法种群的个体,采用改进的遗传算子和群体更新规则,利用遗传算法的高效全局搜索特性实现聚类,克服了受初始解选择的影响而得到次优解的不足。实验结果表明,本文提出的算法在聚类分析中搜索到全局最优解(或近似全局最优解)的能力比较好,为大规模的模式聚类提供一种新的思路。论文网http://www.751com.cn/
关键词:遗传算法,聚类分析,优化算法
A Genetic Algorithm for Clustering Problem Solving
Abstract:
The article combining the advantage of genetic algorithm and the theory of traditional statistical pattern recognition, present a clustering analysis algorithm based on genetic algorithm. The algorithm uses a number of points on two-dimensional as genetic algorithm's individual stocks and uses the modified genetic operators and the improved group rules. Using the efficient of genetic algorithm's global search properties to achieve clustering, overcomes the shortcomings caused by the sub-optimal solution chosen by the initial solution. The experimental results show that the algorithm's ability in the search to the global optimal solution(or approximate the global optimal solution) is better, providing a new way of thinking for large-scale pattern clustering.
Key words:
genetic algorithm,clustering analysis,optimization algorithm
1.引言
1.1课题背景本文来自辣.文~论~文·网原文请找腾讯324.9114
在人工智能领域中,有不少问题需要在复杂而庞大的搜索空间中寻找最优解或准最优解。在计算此类问题时,若不能利用问题的固有知识来缩小搜索空间则会产生搜索的组合爆炸。因此,研究能在搜索过程中自动获取和积累有关搜索空间的知识并自适应地控制搜索过程从而得到最优解的通用搜索算法一直是令人瞩目的课题。
遗传算法(Genetic Algorithm,简称GA)[1]就是这类特别有效的算法之一。GA是由美国学者HOLAND于1975年提出的。它是模拟自然遗传学原理和生物进化论形成的一种全局并行的随机搜索方法。GA的主要优点是简单通用,鲁棒性强,适于并行分布处理以及应用范围广。尽管 GA本身在理论和应用方法上仍有许多有待深入研究的不足之处,但它在组合优化问题求解,自适应控制,自动生成程序,机器学习和人工生命等领域的应用中已初步展现了它的特邑和魅力,成当前十分热门的研究课题。
在自然科学和社会科学中,存在着大量的分类问题[2]。聚类分析,简称聚类,它是研究(样品或指标)分类问题的一种统计分析方法。聚类起源于分类学,在古老的分类学中,人们主要依靠经验和专业知识来实现分类,很少利用数学工具进行定量的分类。随着人类科学技术的发展,对分类的要求越来越高,以致有时仅凭经验和专业知识难以确切地进行分类,于是人们逐渐地把数学工具引用到了分类学中,形成了数值分类学,之后又将多元分析的技术引入到数值分类学形成了聚类。
1.2研究意义
聚类分析是统计模式识别中一个很重要的分支,前提是已知若干对象和它们的特征,但是不知道每个对象属于哪一类,而且事先并不知道究竟分成多少类,在此基础上用某种算法将特征相似的归为一类。为了避免传统算法的缺陷以及结合遗传算法的优势,在传统的基于统计学理论的聚类算法基础上,提出一种基于遗传算法的聚类算法。基于遗传算法的聚类方法的优点是不需要关于待分类数据的先验分布知识,也不会受初始解选择的影响而得到次优解。
1.3本文工作本文来自辣.文~论~文·网原文请找腾讯324,9114
本文采用了K-均值算法的基本思想,所不同的是它使用遗传算法而不是一般的迭代来进行聚类划分的优化。将统计学知识和遗传算法结合起来,用遗传算法搜索聚类的最优解,为大规模的模式聚类提供一种新的思路。2329
[1] [2] [3] [4] [5] [6] [7] 下一页