基于概率因子模型的社会图像标签细化(3)

和语义相似点间的一致性的同时，最小化来自初始用户提供的标签的偏差[3]
。Liu 等通过模拟
标签相似点和图像相似点，根据有关图像的关联对标签进行重排序[13]
。Wang等人提出了一
种基于内容的在有限步距内重启框架的方法来细化图像标签[17,18]
，这种方法同时考虑了视觉
相似点和以视觉相似点为条件的文字共现。另外，Jia等人提出了与之相似的工作，即将标签
的文本相似点和图像的视觉相似点融合到一个多图表加强框架中[19]
。Liu 等提出了一种基于
多边缘图表的统一框架来解决图像标注标签到区域和标签细化的问题[20]
。Sang 等人通过利用用户信息，提出了一种张量分解框架来模拟用户-图像-标签这三者之间以及各自内部的关系
[21]
，在相应的潜子空间中描绘出用户、图像和标签，给定一个图像，具有最高交叉空间满意
度的标签将被作为最终标注。
此外，由于图像标注、图像标签细化对图像-标签关系矩阵的处理是一项十分庞大的工
程，所以目前最先进也最流行的是矩阵分解[2,3,6]
的方法。矩阵分解的方法可以降低计算的复
杂度，包括概率矩阵分解（probabilistic matrix factorization, PMF）、贝叶斯概率矩阵分解
（Bayesian probabilistic matrix factorization, Bayesian PMF）、非负矩阵分解（nonnegative
probabilistic matrix factorization, NPMF）等方法。Hofmann T 等人提出了一些基于概率因子的
模型[22,23,24]
，我们可以将这种模型适当改进应用到图像标签细化当中。这些模型都可看作图
表模型。在这些模型中，隐藏因子变量和代表用户评论的变量有着直接的关系。这种模型最
大的缺点就是精确地推理十分困难[25]
，也就意着需要潜在的低速的和不精确的近似值来计
算隐藏因子的后验分布。最经典最基础的是一种概率矩阵分解（PMF）模型[26]
，根据统计到
的数据进行线性测量，这种模型在大的、稀疏的、甚至是十分不平衡的 Netflix 数据集中都能
取得很好的效果。
与本文最相近的是Ma等人提出的算法，它为解决网站推荐的问题提出了一种基于降
文技术的概率因子模型[27]
，并通过包含异质源将其扩展为集体概率因子模型以提高模型性能。
由于概率矩阵分解的方法是假定用户矩阵和标签矩阵服从高斯分布，也就是可能出现负数情
况，这与实际情况不符。因此该模型用伽马分布生成用户-未知项矩阵和站点-未知项矩阵。
这种模型的应用范围很广，可被应用于很多网络应用。该模型主要基于以下几点，利用隐含
的用户站点频率数据来构建的概率因子模型框架：（1）网络用户对不同网站的偏爱可由浏览
频率得知；（2）高频浏览意着该网站上巨大信息量的需求；（3）用户问询发行频率数据可
用来定义用户的喜好。
本文中将采用 Gamma 分布生成用户矩阵和标签矩阵的概率因子模型算法，来实现社会
图像标签的细化。
另外，为了解决用户提供的标签不精确、不完整的问题，我们需要同时考虑图像-图像和
标签-标签之间的关系，即以下两个要素。首先是内容一致性：通过对大规模图像数据集的观
察，我们会发现，相似的图像通常反映相似的主题，也因此由相似的标签进行标注。内容一
致性描述的是内容层和语义层之间的关系。内容一致性作为一个十分重要的先验知识，已经
得到了十分广泛的研究[28,29]
。其次是标签相关性：和同一幅图像相关的语义标签一般都不单独出现，很多时候它们都是同时出现，并且在语义层相互影响。标签相关性描述的是语义层基于概率因子模型的社会图像标签细化(3):http://www.751com.cn/jisuanji/lunwen_20075.html