1.1 课题研究背景
二十一世纪是一个互联网飞速发展的世纪,从我们手机上的应用软件不断地更新就可见一斑。相应的互联网也需要更新换代,其中图形的检索便是当中的重要代表。随着手机上网的普及,使得我们在web上浏览信息不再局限于使用笨重的计算机,不再局限于地点。只要我们有一个手机,然后接入互联网我们就能够,不论何时,何地,快速地查阅我们所需要的各种信息。但是伴随着人们的需求在增加,图形检索技术并没有跟上节奏。作为一个当事人我深有体会。图形可以说是大部分用户对于获取网络信息最直观的来源。但是现今的图形检索工具往往不能满足用户的需求。因此跟上社会发展的脚步,满足用户的需求成为现今图形检索最主要的任务。而完成这个任务主要有以下两大难题:
其一,我们都知道最初的图形检索系统其实是通过人工对图形进行标注来进行索引搜索。这种情况在最初数据库小,而且用户也不多的时候还是勉强凑和能用的。但是现在的互联网数据库中的图像太多了,靠人工标注这根本不可能。并且自然语言存在偏差以及人工标注的
不可控性,误差在所难免。在此基础发展的基于内容的图形检索技术相较于之前的有所提高,但是并不能完全满足用户需求。毕竟纯粹利用图形底层特征去与我们自然语言配对这存在很大的难度。这也是目前大多数搜索引擎存在的通病。纵观互联网的图形检索系统,由于图形所连带的内容非常多。比如一个图像常常附带标题,内容说明,出自哪里等等。这些语义必不可少,因为这是查找该图像必不可少的因素。而我们要做的就是让我们所设计的低层次语言能更加准确地识别出这些高层次语义。从而用户能够更快、更准确地找到所需要的图像。
其二,对于检索所返回的结果需要有一个适当的分类。就当今主流的搜索工具(例如Google和Baidu)而言,本质上他们的图像返回结果并没有分类。理论上返回结果只能有一个类别。但是由于检索系统在识别用户键入的关键字时并不能完全理解用户的需求。并且在识别自然语言时都存在多义性,造成返回结果具有多个分类。举个例子,我们在百度中搜索“泰山”它出来的有五岳之一的泰山,也有西方童话里的人猿泰山。这给用户带来了不小的的不便。因此,急需一种能将同义的图片归类的一种分类机制。
1.2 图形检索的研究与现状
1.2.1 图形检索的工作原理
在这个信息大爆炸的时代,网络上充斥着大量杂乱无章的图形信息。这虽然是互联网发展所必须经历的阶段,但是对于处在这个时期的我们却带来了很大的困扰。伴随着计算机容量越来越大,存储速率越来越高。越来越快捷的图像存储给我们带来了方便,我们却没有发展出高效的处理后事的方法。简单说就是我们并不能像存储图像一样快速准确地取出图像。应运而生的图形搜索引擎为我们提供了一种可用的方法。简而言之,搜索引擎是一种互联网技术,搜索引擎技术,图像数据库技术相结合的产物。
对于搜索引擎的定义有两方面,广义上来讲图形检索是指网络环境下应用于图像检索,查询的搜索引擎。主要包括有图像数据库搜索引擎[19]和网络图像搜索引擎等等。狭义上指网络图像搜索引擎。
图像检索引擎的特点也有两方面:其一,不同于传统图像检索系统,它的图像是分布式存储。其二,是格式内容的多样性,区别于传统图像数据库的单一性(图像尺寸单一,图像类别单一)。现今图像搜索引擎所要面对的是整个互联网的图像。鉴于各个网站图像千差万别,格式内容也往往大不相同。因此对图像进行预处理和过滤等操作是十分有必要的。
- 上一篇:基于时间序列的软件可靠性建模技术研究
- 下一篇:基于IPCTC的网络隐蔽信道的设计与实现
-
-
-
-
-
-
-
河岸冲刷和泥沙淤积的监测国内外研究现状
当代大学生慈善意识研究+文献综述
电站锅炉暖风器设计任务书
酸性水汽提装置总汽提塔设计+CAD图纸
大众媒体对公共政策制定的影响
java+mysql车辆管理系统的设计+源代码
乳业同业并购式全产业链...
杂拟谷盗体内共生菌沃尔...
十二层带中心支撑钢结构...
中考体育项目与体育教学合理结合的研究