3 中英文图书标签数据采集 9
3.1 中英文图书网站 9
3.2 中英文图书标签数据采集 10
3.3 数据采集结果 17
4中英文图书标签的比较分析 20
4.1中文图书标签的比较 20
4.1.1 中文图书标签数量比较 20
4.1.2 中文图书标签长度比较 22
4.1.3 中文图书标签重合度的比较 23
4.2英文图书标签的比较 23
4.2.1 英文图书标签数量比较 23
4.2.2 英文图书标签长度比较 25
4.2.3 英文标签重合度比较 27
4.3中英文图书标签的比较 27
5.图书标签发展的建议 29
5.1 增加图书标签的个数 29
5.2 升级图书馆的标签系统 29
5. 3 改善图书推荐系统 29
6.总结 30
6.1 总结 30
6.2 不足之处 30
6.3 未来研究展望 31
致谢 32
参考文献 33
图 表 目 录
图1- 1本文研究思路 4
图3- 1数据采集流程图 11
图3- 2豆瓣主页 12
图3- 3豆瓣图书标签采集过程 13
图3- 4国图图书标签采集过程 14
图3- 5美国国会图书馆图书标签获取过程 15
图3- 6亚马逊图书标签获取过程 15
图3- 7 Library Thing图书标签获取过程 16
表3- 1豆瓣图书标签数据 17
表3- 2国图图书标签数据 17
表3- 3国会图书馆标签数据 17
表3- 4 Amazon图书标签数据 18
表3- 5Library Thing图书标签数据 18
表4- 1 图书分类 19
表4- 2中文图书标签数量 20
表4- 3中文标签平均数量 20
表4- 4中文图书标签长度 21
表4- 5 英文图书标签数量 23
表4- 6英文图书标签平均个数比较 24
表4- 7英文图书标签平均长度 25
表4- 8中英文图书标签比较 27
1 绪论
1.1 选题背景
随着信息技术的不断迅猛发展,我们进入了Web2.0时代。Web2.0时代最明显的特征就是用户的参与性大大增加,互动性和个性化的特质不断显现,用户不再是信息的被动接收者,更加是信息的创造者。在此过程中,用户的主动性尤为突出。在网络信息组织、信息聚类和信息检索的过程中,最具有鲜明特色的就是社会标注。在这些各具特色的社会标注中,图书标注的变化更是翻天覆地。图书标注的历史悠久,但是传统的图书标注已经无法满足人们的需求,在用户的强烈需求之下,一些图书网站开放了标签功能,让用户自主添加标签;而国家图书馆则是开放已经标注成功的标签,供用户使用。不管是哪种标签,它们的最终目的都是为了用户能够更加方便快捷的获得所需信息。因此,本文以国家图书馆、豆瓣的中文标签数据和美国国会图书馆、Amazon和Library Thing的英文标签数据为基础,对中英文标签数据进行比较,为用户更好地使用标签获取数据提供帮助。论文网 中英文图书标签的比较研究(2):http://www.751com.cn/guanli/lunwen_73989.html