哈希技术按照有无参考还可以分为三类即非监督哈希、监督哈希与半监督哈希。监督哈希是指提供真实参考值作为监督信息进行训练的哈希,它的检索效果较好但训练时间较长。半监督哈希是监督哈希与非监督哈希的一种复合,比监督哈希节约训练时间,比非监督哈希检索精度高。非监督哈希在大规模检索当中速度快但是精度低。
因此根据有无监督信息,跨模态哈希检索还可以进一步分为无监督的跨模态哈希检索和有监督的跨模态哈希检索。
例如基于典型相关分析(CCA)[12]的哈希检索就属于无监督的跨模态哈希检索。CCA的方法就是将两个模态信息投影到同一个隐空间中,令两个投影后的视图间的关联在这个隐空间中最大。这个空间是跨模态的,也就是说无论哪个模态都可以转化到这个空间中。例如图像和文本作为两个模态,图像检索图像、图像检索文本和文本检索图像都可以通过这个空间来进行任务。
在许多实际应用中,除了多模态(多视图)特征信息之外,语义标签也可用于数据点。这样的监督信息,通常由人提供,对于哈希函数学习是非常有区别的。因此,监督CMH方法,可以利用监督信息进行哈希,已经得到了越来越多的研究者的关注。代表性监督的CMH方法包括跨媒体哈希索引(CMSSH)[13],跨视图哈希(CVH)[14],基于概率图模型学习哈希函数(MLBE)[15]和协同正则的哈希函数学习(CRH)[16]。CMSSH旨在使用特征分解和增强来学习两个模态的两个哈希函数。CVH将谱哈希扩展到多模式型。 MLBE直接学习带有潜变量模型的二进制哈希码。 CRH通过求解凸函数程序的差异来学习,而多位的学习通过增强过程表现。
李武军提出了一种称为语义关联最大化(SCM)[1]的新型SMH方法,SCM是一种监督哈希,将语义标签无缝集成到大规模数据建模的哈希学习过程中。SCM的模型中两模态每个对应配对样本都有一个语义作为其监督信息,它的目标函数是使得两模态映射后哈希码跨模态两两间余弦相似度与对应语义两两间余弦相似度相差最小。
然而实际查询是直接比较映射后哈希码的汉明距离来检索,并不使用语义表,所以虽然两两间的余弦关系一定程度上保持了,可是实际对应的样本哈希码间没有让它的差别尽量小,受到了其它余弦关系的约束。除此之外,人工制作语义表需要耗费大量的人力和时间。 哈希检索国内外研究现状(2):http://www.751com.cn/yanjiu/lunwen_25244.html