2.1 关键词自动抽取研究概述 4
2.1.1选取候选关键词 4
2.1.2抽取关键词 4
2.2 标签自动抽取研究概述 6
2.2.1标签自动抽取 6
2.2.2标签推荐 6
2.3 标签云图 7
2.3.1标签云图的表现方法 7
2.3.2标签云图表现形式 7
3 标签与标签云图自动生成关键技术 12
3.1 中文文本自动分词技术 12
3.2 关键词提取技术 13
3.3 用户标签生成 14
3.4 标签云图与标签时间走势图生成 15
4 系统实现与结果分析 16
4.1 实验数据 16
4.2 系统设计与实现 16
4.2.1 系统框架与具体实现 16
4.2.2 系统演示 17
4.3 实验结果分析 21
4.3.1 所有用户标签与标签推荐分析 21
4.3.2 单篇博文标签推荐分析 22
4.3.3 博主标签推荐分析 25
4.3.4 科学网标签时间走势图分析 26
5 总结与展望 29
5.1 本文工作总结 29
5.2 不足之处 29
5.3 展望 29
附录A:排名前200位的用户标签与机器标签推荐对比表 31
附录B:用户标签权重走势图(2008.02-2011.09) 36
致谢 47
参考文献 48
图 表 目 录
图1. 1 标签云图 1
图1. 2 本文的研究思路 2
图2. 1 用复杂网络图表示的标签云图 8
图2. 2 Spacenav标签云图 9
图2. 3 经过聚类的标签云图 10
图2. 4 Yahoo!的时间河流标签云图 10
图2. 5 TagOrbitals标签云图 11
图2. 6 李开复的微博标签云图 11
图3. 1 基于CHMM的词法分析框架 12
图4. 1 博客标签推荐与标签云图生成系统框架 17
图4. 2 功能选择页面 18
图4. 3 博客在线生成页面 18
图4. 4 标签云图及标签权重图 19
图4. 5 博客作者查询页面 19
图4. 6 博主博文查询结果页面 20
图4. 7 博主博文页面 20
图4. 8 博主所有博文标签页面 21
图4. 9 标签走势图 21
图4. 10 博文1博客原文 22
图4. 11 博文2博客原文 23
图4. 12 杨学祥及其所有博文标签 25
图4. 13 陈龙珠及其所有博文标签 25
图4. 14 周可真及其所有博文标签 26
图4. 15 标签“地震”的时间走势图(2007年2月~2012年1月) 27
图4. 16 标签“方舟子”的时间走势图(2007年2月~2012年1月) 27
图4. 17 标签“科研”的时间走势图(2007年2月~2012年1月) 28 社会标签系统挖掘研究中文博客标签及标签云图的自动生成研究(2):http://www.751com.cn/jisuanji/lunwen_9456.html