中英文Hashtag标签的比较研究(4)

菜单

针对这一现状，本文从Twitter和新浪微博的博文数据入手，提取其中带有Hashtag的博文，利用分词方法对中英文的Hashtag的词性长度等方面进行比较研究，并且通过数据库和代码编写，以图表的方式更加直观明了的呈现出来。

1.3研究内容

本文以新浪微博和Twitter为研究对象，利用自动抓取爬虫程序工具，抽取微博用户相关信息，对微博内容进行收集、整理、加工和分析。并对Hashtags进行提取，构建分类体系，对数据进行预处理之后将中英文Hashtags进行分类、比较研究，重点比较研究中英文Hashtag在词性、长度等统计特征上的分布情况，最后根据分析结果，提出关于更好利用Hashtags的相关建议。

总体思路如图1所示。

图 1 本文的总体思路

1.4本文主要结构

本文分为如下5个章节：

第一章为绪论，主要分析本文的研究背景，Web2.0时代下微博的产生和发展，并指明本文的研究意义，同时简单描述了本文的研究内容。

第二章为文献综述，介绍了标签和分类系统的相关理论，包括标签的定义、类型及应用。调研了国内外关于Hashtag的研究现状。结合理论研究，在接下来的通过详细介绍数据处理及计算结果，对新浪微博和Twitter的Hashtag进行挖掘分析。来~自^751论+文.网www.751com.cn/

第三章为数据处理流程的总体介绍，主要是对本文关于中英文Hashtag在外部特征以及内部特征分析上的一个总体概括与介绍。

第四章为Hashtag的外部特征分析。抓取新浪微博与Twitter的数据并进行整理、加工和处理。调研科学网平台架构、用户群体特点及Hashtag的相关信息。提取中英文的Hashtag，并对数据进行外部特征分析，主要包括中英文Hashtag的数量、长度、频次以及在微博文中出现的位置等方面的统计分析与处理，使数据更加规范合理，便于接下来的分析与比较。

第五章为Hashtag的内部特征分析，针对爬虫程序抓取的微博数据，对Hashtag进行调查统计分析。具体内容包括：词性标注、构建分类体系对中英文Hashtag进行分类、流行标签的统计分析等。处理过程中使用数据库及java等编程语言处理数据。

最后一章是总结与展望，本章中会阐述本文中所完成的工作，并对未来研究进行展望。

上一篇：网络新闻文本中的命名实体自动抽取研究
下一篇：基于Agent的突发事件中网络舆情演变过程中的网民群体行为建模研究

关闭

暂无收藏

About

751论文网手机版...

主页：http://www.751com.cn

关闭返回

中文专业博客的标签质量评估研究

基于Swift和标签模糊匹配的...

Android移动终端SIFT算法的图...

基于概率因子模型的社会图像标签细化

基于车载电子标签的单交...

社会标签系统挖掘研究中...

社会标签系统主题关键词与用户标签比较研究

大众媒体对公共政策制定的影响

电站锅炉暖风器设计任务书

乳业同业并购式全产业链...

当代大学生慈善意识研究+文献综述

酸性水汽提装置总汽提塔设计+CAD图纸

中考体育项目与体育教学合理结合的研究

十二层带中心支撑钢结构...

河岸冲刷和泥沙淤积的监测国内外研究现状

杂拟谷盗体内共生菌沃尔...

java+mysql车辆管理系统的设计+源代码

栏目

About