词语相似度 40 粗糙集 21 算法 16
信息检索 40 色谱指纹图谱 20 属性相似度 16
指纹图谱 38 搜索引擎 20 语义检索 16
自然语言处理 37 计算机应用 20 主观判断 15
语义Web 37 语句相似度 19 复杂网络 15
数据挖掘 31 质量控制 19 相似性度量 15
文本距离 30 权重 18 入侵检测 15
从上表的关键词词频分析可知,相似度分析属于数据挖掘的范畴,在相似度领域,引入了向量空间模型,将抽象的相似度计算转化为具体的向量空间距离计算。其中最常用的计算方法即基于语义相似度计算和本体论方法,聚类分析和遗传算法也是关键方法。而在相似度算法应用方面,主要集中在信息检索系统、图像识别和自然语言处理等方面。
同时从表中还能得关于相似度算法的应用热点,相似度作为机器语言和自然语言相匹配的关键问题,目前研究的热点主要有以下几个方面:在基于实例的机器翻译中,利用句子相似原理进行源语言检索;在信息过滤技术中,利用句子模糊匹配来过滤敏感信息;在自动问答系统中,对于相似文本的检索以及问答句与答案的匹配度。同时指纹识别、人脸识别、图像融合以及图像匹配等也是目前的应用热点。 案例推理系统相似度研究现状(2):http://www.751com.cn/yanjiu/lunwen_16435.html