与本文相关的研究包括用户兴趣建模、用户信息行为和微博内容挖掘。本章将分别对这些研究进行文献综述。
1 用户建模研究用户建模作为个性化服务的核心,它的质量决定了个性化服务的质量。对于用户建模问题的研究一直是学界的热点话题,学界对用户建模的研究集中于用户建模的定义、过程、类型以及方法等方面。82852
1。1 用户建模的定义和过程
用户建模是获取和维护用户兴趣、需求和习惯的过程,最后得到表示用户特有兴趣的用户模型[3]。用户建模的内容一般包括两个方面:一方面,通过记录和分析用户浏览行为、浏览内容及用户反馈等收集用户信息,从中挖掘用户兴趣;另一方面,用合适的方法表示用户兴趣(即用户兴趣模型),并随用户兴趣变化动态更新用户兴趣模型[4]。
吴丽花和刘鲁的研究中将完整的推荐系统用户建模过程概括为用户信息收集、模型表示、模型学习与模型更新4个模块[3]。而在王巧容、赵海燕和曹健的研究中将用户建模的过程分为输入、输出、建模时间、建模的对象、建模算法5个关键模块[5]。 82852
1。2 用户建模的类型及方法
按照用户建模的获取方法的不同,可将用户建模分成显式建模和隐式建模两种。早期用户建模方法主要属于显式建模:第一种方式是用户主动对其网页的内容的兴趣度进行标注,根据标注结果在用户进行检索时提供相应的结果;第二种方式是收集用户检索后对结果的评价,系统根据评价信息改善检索结果,最后通过网页排名指向相关页面[6]。显式建模的方法具有准确性高、用时少的优点,但是使用者总建模方法可能会涉及用户隐私,而且也需要用户较高的参与度,用户很容易产生厌倦感,从而影响主观评价结果。由于显式建模具有以上局限,学界开始研究用户建模的另一种类型——隐式建模。这种建模方式可以通过用户浏览行为,比如用户浏览页面时的动作和浏览的内容等,也可以通过采集服务器日志信息的方式,比如用户IP地址、访问时间、访问地点等挖掘用户兴趣[7]。隐式建模不需要用户的主动参与,但是其建模所需挖掘的数据量很大比较难保证建模结果的准确性。为了充分发挥这两种建模方式的优势,可以通过显式建模获取静态用户信息,采用隐式建模获取动态用户信息。
另外,按照用户模型表示方式的不同,又可以将用户建模分为以下三类:基于关键词的用户建模、基于类别的用户建模和基于潜在主题的用户建模[8]。论文网
用户建模目前的研究集中于用户兴趣建模方面。综合前面学者的研究,本文将用户建模的过程概括为:用户信息采集,用户特征提取,用户模型表示,用户模型评价。在下文中将对这四个过程展开的具体工作进行介绍。用户建模的类型也是多样的,一般可以根据用户信息获取方式的不同分为显式建模和隐式建模,这两种类型各有优劣,所以提出了显式建模和隐式建模结合的建模方法。
2 用户信息行为研究
用户信息行为是微博作用发挥的载体,通过对用户信息行为的深入研究能够探求微博作用的机理。
1 用户信息行为的定义
学界对于用户信息行为较为成熟的定义是针对传统的用户信息行为的,可以总结为以下3种:
(1)用户信息行为是在动机支配下,用户为了达到某一特定的目标的行动过程[9]。
(2)用户信息行为是在认知思维支配下对外部环境做出的反应,是建立在信息需求和思想动机基础上,历经信息查寻、选择、搜集各过程,并为用户吸收、纳入用户思想库的连续、动态、逐步深入的过程,如明确信息需求的实质、选择适当的信息系统、制定正确的检索策略等[10]。