摘要越来越多的社交网站,如Flicker和 Facebook,允许用户上传和分享图像。同时,用户可以自由地为这些图像标注任何他们喜欢的标签。然而,用户提供的大量标签往往是不精确或是不完整的。这是由于用户标注的标签具有主观性和随意性,而不能很好地反映图像的语义信息。为了解决上述问题,本文采用了一种概率因子模型(probabilisticfactor model, PFM)方法来细化社会图像的标签,滤除不相关的标签并补充相关的缺失标签。进一步地,本文将这种概率因子模型进行了拓展,引入了图像内容一致性和标签语义相关性约束,并提出了约束概率因子模型(constrained probabilistic factormodel, CPFM) 。为了验证提出算法的有效性,本文在一个真实的社会图像数据集上进行了实验。实验结果证明了本文算法的优越性。26039 毕业论文关键词 社会图像 标签细化 概率因子模型 约束概率因子模型 图像内容一致性 标签语义相关性
Title Probabilistic Factor Models for
Social Image Tag Refinement
Abstract
An increasing number of online social media sharing systems such as Flicker and
Facebook allow users to upload masses of images. Meanwhile, users are allowed to
freely annotate the images with any tag they prefer. However, the abundant tags
provided by users are frequently imprecise and incomplete because the users often
annotate the images subjectively and casually while cannot reflect the semantic
information of the images. In this paper, in order to settle the problem
aforementioned, the author utilizes a probabilistic factor model(PFM) to refine
the tags of the social images, filtering out the irrelevant tags and complementing
the missing tags. The PFM model is further extend to a constrained probabilistic
factor model(CPFM) model containing content consistency and tag correlation. To
verify the effectiveness of the two proposed methods, this paper conducts several
experiments on a real-world web image database. The experimental results
demonstrate the superiority of the proposed method.
Keywords Social images Tag refinement Probabilistic factor model
Constrained Probabilistic Factor Model Content consistency Tag correlation目 次
1 引言 1
1.1 研究目标及意义 1
1.2 研究现状 1
1.3 本文的研究内容 4
1.4 本文的组织结构 4
2 基础知识——概率矩阵分解(PMF) 5
3 基于概率因子模型的社会图像标签细化 7
3.1 问题描述 7
3.2 概率因子模型(PFM) 7
3.3 约束概率因子模型(CPFM). 9
4 实验分析 13
4.1 数据集 13
4.2 度量标准 13
4.3 比较的算法 14
4.4 PMF、PFM、CPFM 算法的比较 14
4.5 文度 d 的影响 16
4.6 参数αk和βk的影响.16
4.7 参数 a 和 b 的影响 17
结 论 19
致 谢 20
参 考 文 献 21图 1.1 社会图像中的用户、图像和标签关系图.2
图 3.1 一幅来自 Flicker 的图像以及它的标签。带下划线的标签为正确描述图像内容的标签,
剩下的为与内容无关的标签。 7
图 4.1 PMF、PFM 和 CPFM 三种算法对单个标签的细化结果 15
图 4.2 不同d 值对 PMF、PFM、CPFM 三种算法结果的影响. 16
图 4.3 CPFM 算法中参数αk的影响.16
图 4.4 CPFM 算法中参数βk的影响.17
图 4.5 CPFM 算法中参数 a的影响 17
图 4.6 CPFM 算法中参数 b的影响 18
表 4.1 PMF、PFM、CPFM 算法的比较 141 引言
1.1 研究目标及意义
随着计算机、网络等技术的发展,以及智能移动终端的普及,具有丰富信息的社会图像
呈现爆炸式增长。为了管理和利用这些图像信息,对图像的组织、分析、检索和管理等成为