6.4 测试流程 17
6.5 CCA,SCM-Orth,SCM-Seq间的对比与分析 17
6.6 SCM算法改进后的实验对比与分析 18
总结 20
致谢 20
参考文献 20
语义关联最大化的跨模态哈希检索算法研究
引言 随着信息社会迅猛发展,多媒体数据也爆炸式涌入网络。在整个互联网的发展中,我们可以发现如今互联网为人类所呈现的不仅仅是一开始的简单文本信息,还有相当多的其它媒体形式,例如图像、视频、音频等。随着21世纪物理技术的进步,拥有大规模和容量的存储介质得到全面地普及,同时在各个领域也被广泛应用。在理论层面上的编码压缩技术也使得多种媒体形式的数据在网络上占有越来越大的比重。对大量多媒体数据的检索具有重大意义。
1.绪论
1.1 研究意义
因为信息技术的迅猛发展和互联网的普及,特别是随着脸书、微博、微信等社交网站与社交软件的流行,图像数据每天都按惊人的速度大量被创造。由相关资料显示,脸书的用户每月上传多于10亿张图片,而已经注册的用户超过了10亿;国内的新浪每天的微博更新条数也超过了一亿。除此之外各种图像获取设备普及也使大量的图像数据被收集。如何管理与检索大量的图像数据是值得研究的问题。图像检索在计算机视觉和模式识别中是研究热点,然而传统图像检索算法所需的计算量很大。近年,基于哈希的图像检索技术得到广泛关注。
越来越多的多模态数据可用于许多应用,特别是在多媒体领域。如何利用这种多模态数据进行跨视角相似性搜索已经成为一个具有挑战性但有趣的研究问题。
1.2 国内外研究现状
研究目的与内容
跨模态检索简单的说就是查询的模态与检索结果的模态不一样的检索。举个例子,用户使用图像来检索文本或者用文本来检索图像,也可以使用图像来检索音频或者是视频。跨模态检索的重点是将不同模态之间的关系进行建模,很明显的,要构建不同模态间的关系,就要跨越不同模态语义上的鸿沟。
跨模态哈希就是将属于不同模态的数据通过投影函数投影到同一个文度较低的汉明空间里,也就是将不同模态、不同文度数据的特征转化为同一文度的二进制表达,通过比较映射后码的汉明距离来实现检索。
跨模态哈希检索可广泛应用于各种图像数据的管理,适用于各大搜索引擎、各大社交网站,企业或各组织对图像及文本数据的管理、检索也会有需求。本文为方便理解,便使用图像与文本来表示两种模式,与之相对应的语义表作为监督信息。研究目的是实现CCA,SCM-Orth和SCM-Seq三种算法并进行实验比较,除此之外,针对这些算法做出改进并与原本的三种算法进行比较分析。
1.4 论文组织结构
论文的第二部分介绍算法研究中主要需要掌握的预备知识;第三部分是CCA,SCM-Orth,SCM-Seq三种算法的阐述实现;第四部分是基于已有算法进行算法改进;第五部分是已有三种算法和改进后两种算法的演算流程;第751部分是三种已有算法的实验分析对比以及改进后两种算法与已有算法的实验分析对比;最后是总结展望与致谢。
2 算法研究预备知识
本文中的研究需要知道矩阵与矩阵的迹的基本运算方法、求导方法和基本性质;需要使用拉格朗日乘子法。
2.1 拉格朗日乘子法
拉格朗日乘子法是一种关于极值问题的方法,它根据给出的约束条件引入新的未知标量,通过函数极值点性质来构建方程组,从而求出极值点和未知数。此方法将具有m个约束条件和n个变量的最优问题转化为可构建具有m+n个变量的方程组的极值问题,而它的变量不受约束。[17]拉格朗日乘数就是该方法引入的新标量未知数,同时它是一组向量系数,对应其约束方程的梯度线性组合向量组。 语义关联最大化的跨模态哈希检索算法研究+源代码(2):http://www.751com.cn/jisuanji/lunwen_25243.html