在近几年中,各种方法已经被提出用来为用户找到有意义的旅游景点甚至进一步提供经 典的旅游景点游玩顺序以实现个性化推荐,为用户在准备旅游计划时提供了极大的便利。根据 数据源的种类,当前的旅游景点推荐方法可以大抵分为 3 类:基于 GPS 轨迹的方法、基于游记 的方法和基于地理标注照片的方法。74260
1 基于 GPS 轨迹的方法
基于 GPS 轨迹的方法被广泛运用于旅游推荐的早期阶段。Zheng et al。 [15–17]利用 GPS 轨 迹数据来挖掘旅游景点和经典的旅游顺序,并利用用户在位置历史方面的相似性提供了一个 个性化的旅游景点推荐。基于 GPS 轨迹的方法的存在的主要问题是由于隐私性问题,相较于 其他方法难以获取来自大量用户的数据源。
2 基于游记的方法
基于游记的方法关注于从博客中挖掘与旅行相关的知识。基于当地的博客,Kori et al。 [18] 通过分析博客中的文本并且聚集旅游数据来提取出这个区域内的典型旅行模式。他们也提出 了一个从博客中提取某个景点的典型旅游经历的方法[19]。Ji et al。[20]通过一个基于图的方法强 调挖掘城市里的著名旅游景点。Gao et al。[21]主要关注为游客自动识别并排序旅游景点。Hao et al。[22]提出了一个景点概览生成方法,首先从游记中挖掘代表景点的术语,然后利用这些术语 来检索网络照片。Hao et al。[23]提出了一个概率主题模型,从游记中挖掘主题然后用恰当的主 题来表示景点以便进一步的目的地推荐和概述。基于游记的方法存在的主要问题是:(1)很 难去评判博客作者是否真正参观了这些旅游景点(2)由于游记通常是无结构的并且包含了大 量噪声,很难去决定游记的特定位置。 论文网
3 基于地理标注照片的方法
Arase et al。 [9]提出了一个探测人们的惯常旅行模式(例如参观城市的典型顺序、停留时间 以及描述旅行模式的标签)的方法:首先利用拍照时间差、位置差距和标签差距将照片集按 事件划分(提取出不同旅行事件的照片集),检测城市名与参观时间,然后基于旅行主题对它 们进行分类,采用 TAS 算法挖掘每个旅行主题的常见旅行模式,并基于 TF/IDF 技术利用附 于照片的标签(考虑标签的地理覆盖面)来提取每个旅行模式的典型描述。实验验证此方法 划分旅行事件照片的正确率为 78%,能够对 80%的旅行照片进行分类,优于其他基线方法。
Clements, M。[24]提出了基于用户在其他城市的 Flickr 地理标签来预测其在某一城市最喜 爱的景点的方法:首先用 mean shift 聚类算法找出各城市的热门景点并基线排序,然后基于 高斯核卷积定义两个用户的地理标签分布的相似度,并结合最为相似的用户的地理标签来个 性化为该用户重新排序目标城市的热门景点。
Lee et al。 [26]提出了一个结合了两个流行数据挖掘技术——聚类和关联规则挖掘的框架, 使用 DBSCAN 聚类算法挖掘 POI 并使用 Apriori 算法挖掘 POI 关联规则(最先对 POI 进行关 联规则挖掘的工作)。
Kurashima et al。 [13]提出了利用用户在社交网站上发布的历史照片来推荐旅行路线的方法: 首先用 mean shift 聚类算法提取出最常被拍照的城市地标,然后结合主题模型和 Markov 模型 来建立拍照者的行为模型来估计他参观某一地标的概率(基于旅行者即将去的下一个地理位 置极大地取决于当前及最近参观的景点以及旅行者下一步行为的选择也由其兴趣决定这两个 假设),最终基于上一步建立的模型提出一种最优优先搜索算法来推荐一个地标序列(即旅游 路径)。之后,他们又在生成旅行路径的过程中考虑了不同交通方式所需的旅行时间[1]。 网上旅游景点推荐方法研究现状:http://www.youerw.com/yanjiu/lunwen_84804.html