4.3中英文Hashtag的长度与频次统计 14
4.3.1Hashtag的长度 14
4.3.2Hashtag的频次 15
4.4 Hashtag在微博文中出现的位置 16
4.5中英文Hashtag外部特征比较结果 18
5 Hashtag数据内容特征分析 20
5.1词性标注 20
5.1.1词性标注与词性频次统计 20
5.1.2中英文词性标注比较结果 23
5.2中英文Hashtag的分类 23
5.2.1区分客观标签和主观标签 23
5.2.2中英文Hashtag分类 24
5.2.3中英文Hashtag分类比较结果 28
5.3流行Hashtag分析 29
5.3.1流行Hashtag统计 29
5.3.2中英文流行Hashtag比较结果 31
5.4中英文Hashtag内部特征比较结果 32
6论文总结 33
6.1结论 33
6.2不足之处 34
6.3未来工作展望 34
致谢 36
参考文献 37
图表目录
图 1 本文的总体思路 3
图 2 Hashtag的例子 6
图 3 本文对数据处理的流程图 11
图 4 新浪微博数据集 12
图 5 Twitter数据集 13
图 6 中英文Hashtag长度比较 18
图 7 中英文Hashtag频次比较 19
图 9中文Hashtag词性提取 21
图 10英文Hashtag词性提取 22
图 11 中英文Hashtag的词性比较 23
图 12中英文Hashtag的客观标签与主观标签比较 29
图13 各分类下中英文Hashtag的频次 29
表 1 7种标签类型[7] 7
表 2中文Hashtag长度 14
表 3英文Hashtag长度 14
表 4中文Hashtag的频次与个数 15
表 5英文Hashtag的频次与个数 16
表 6中文Hashtag出现的位置 17
表 7英文Hashtag出现的位置 17
表 8 中英文Hashtag外部特征比较结果 19
表 9 中文Hashtag的词性频次统计 21
表 10 英文Hashtag的词性频次统计 22
表 11中文Hashtag的分类例子 25
表 12英文Hashtag的分类例子 26
表 13中文Hashtag各类别个数分布统计 27
表 14英文Hashtag各类别个数分布统计