社会标签系统主题关键词与用户标签比较研究(4)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

社会标签系统主题关键词与用户标签比较研究(4)


2.2    主题关键词
2.2.1    主题关键词的定义
关键词顾名思义就是关键性的词语,从语言学上来讲,关键词就是能描述文章本质的词语,信息检索领域将关键词理解为表示文献实质意义的那些名词或词组,常出现在文献篇名、摘要或文献正文中。每篇文档都应有关键词,以确定文档的主题,并通过关键词来区别于其他的文档,这样有利于文档的检索、查询、以及方便信息的交流与传递。关键词广泛应用于新闻报道、科技论文等领域,以方便人们高效的管理和检索文档,随着网络时代信息爆炸式的增长,关键词成为用户在海量信息中检索感兴趣内容的主要工具,诞生了如Google、百度等基于关键词的搜索引擎。在社会科学中,历史文档中关键词使用频度、内在含义等方面的变化也成为研究人类社会、文化和政治观念演变的重要途径[14]。
美国计算机学会主办的某学术会议论文作者为其论文提供了三种类型的关键词,第一种是“类别和主题描述”,表示了论文的学科类别;第二种是“通用术语”,这些词汇无法归入分类体系树,用来表示论文的类型;第三种是典型意义上的“关键词”,由论文作者自由制定,用来概括论文的主题。在传统的科技论文库和新闻库中,人们一般请专家为待标注对象标注关键词。因此,关键词的选取都是遵循一定规范的,是为了满足文献标引或检索工作的需要而从信息资源中选取出的词或词组[1]。
2.2.2    基于关键词的传统标引系统
传统的主题标引方法中,以图书馆主题标引为例,大多数的图书馆提供主题途径,即由专业的编目人员通过查主题词表为其馆藏资源配置主题标目[15]。但是,主题词表提供的标引规则非常复杂,对于普通的用户而言,这些受控、规范的主题词可能是难以理解的。
2.3    主题关键词与标签的比较现状
N. Titus认为[16],社会标签是用户自由选择与目标对象相关的关键词对该对象进行信息标识的结果。它与用户对该对象的理解程度与用户对词汇的把握能力有关。魏建良等人[17]在阐述社会化标注的时候,认为标签类似于关键词,它被用户用来对发布的信息进行标注,它与关键词不同的是,标签的标注不存在词与权限的限制,而关键词往往只能由信息的发布者或创建者添加。丁婉莹等人[18]认为标签和关键词均是标引词,但是标签是基于语义的,而关键词是基于语法的。两者的表现形式不同,但是两者存在潜在联系。
Kipp在她的研究中探讨了大众标签、作者标引的元数据以及中间人所标注的关键词之间的区别[19]。通过分析数据得出许多大众标签与作者和中间人给出的关键词相关,大众标签能以很低的成本对资源进行描述,但是仅仅当用户标签能够提供相似或者更好的搜索文本时大众标签才能发挥作用。常唯[20]通过研究标签与关键词的比较以及对标签与被标注对象内容之间的关系的挖掘,探讨了标签在揭示数字学术资源方面的能力。潘婵等人[21]以Del.icio.us为平台,测试了不同领域标签和关键词的相似度,发现娱乐领域和学术领域的标签和关键词的相似度有很大差别,然后,又固定用户群,对不同领域对象进行标引,其标签与关键词相似度相差不大。因此,认为在网络上有通过用户自组织形成的“用户群”的存在,网络用户因为兴趣、知识背景等多种原因聚集成群,不同群体的用户影响了对不同领域的网络数字对象的标引行为。
 
3     主题关键词与社会标签系统的比较
3.1    实验目的 (责任编辑:qin)