2.1    关键词自动抽取研究概述    4
2.1.1选取候选关键词    4
2.1.2抽取关键词    4
2.2    标签自动抽取研究概述    6
2.2.1标签自动抽取    6
2.2.2标签推荐    6
2.3    标签云图    7
2.3.1标签云图的表现方法    7
2.3.2标签云图表现形式    7
3    标签与标签云图自动生成关键技术    12
3.1    中文文本自动分词技术    12
3.2    关键词提取技术    13
3.3    用户标签生成    14
3.4    标签云图与标签时间走势图生成    15
4    系统实现与结果分析    16
4.1    实验数据    16
4.2    系统设计与实现    16
4.2.1 系统框架与具体实现    16
4.2.2 系统演示    17
4.3    实验结果分析    21
4.3.1 所有用户标签与标签推荐分析    21
4.3.2 单篇博文标签推荐分析    22
4.3.3 博主标签推荐分析    25
4.3.4 科学网标签时间走势图分析    26
5    总结与展望    29
5.1    本文工作总结    29
5.2    不足之处    29
5.3    展望    29
附录A:排名前200位的用户标签与机器标签推荐对比表    31
附录B:用户标签权重走势图(2008.02-2011.09)    36
致谢    47
参考文献    48
图  表  目  录
图1. 1  标签云图    1
图1. 2  本文的研究思路    2
图2. 1  用复杂网络图表示的标签云图    8
图2. 2  Spacenav标签云图    9
图2. 3  经过聚类的标签云图    10
图2. 4  Yahoo!的时间河流标签云图    10
图2. 5  TagOrbitals标签云图    11
图2. 6  李开复的微博标签云图    11
图3. 1  基于CHMM的词法分析框架    12
图4. 1  博客标签推荐与标签云图生成系统框架    17
图4. 2  功能选择页面    18
图4. 3  博客在线生成页面    18
图4. 4  标签云图及标签权重图    19
图4. 5  博客作者查询页面    19
图4. 6  博主博文查询结果页面    20
图4. 7  博主博文页面    20
图4. 8  博主所有博文标签页面    21
图4. 9  标签走势图    21
图4. 10  博文1博客原文    22
图4. 11  博文2博客原文    23
图4. 12  杨学祥及其所有博文标签    25
图4. 13  陈龙珠及其所有博文标签    25
图4. 14  周可真及其所有博文标签    26
图4. 15  标签“地震”的时间走势图(2007年2月~2012年1月)    27
图4. 16  标签“方舟子”的时间走势图(2007年2月~2012年1月)    27
图4. 17  标签“科研”的时间走势图(2007年2月~2012年1月)    28
上一篇:中国学术界和华人影视界X度空间理论初探
下一篇:ASP.net师生交流平台的开发+文献综述

java+mysql通用试题库系统后台设计与实现

PHP+IOS的会议管理系统的设计+ER图

基于网络的通用试题库系...

银行行办公信息服务系统【1544字】

用友NC信息系统的实施應用实践研究【3307字】

浅析嵌入式系统支柱學科...

水电站实时监控专家系统【950字】

医院财务风险因素分析及管理措施【2367字】

公寓空调设计任务书

承德市事业单位档案管理...

C#学校科研管理系统的设计

国内外图像分割技术研究现状

志愿者活动的调查问卷表

AT89C52单片机的超声波测距...

神经外科重症监护病房患...

中国学术生态细节考察《...

10万元能开儿童乐园吗,我...