菜单
  

    3.2 数据资料收集与整理

        笔者通过百度、谷歌等搜索引擎,输入“驴友旅游安全”关键字,不断收集新闻游记约96篇。

    为了保证样本的真实性和研究的规范性,剔除旅游商家发布的文章,选取真实的新闻文章,剔除照片或视频,然后对此进行合并。笔者将筛选出的文章进行文本转换,以便与特征词的提取。然后剔除了所有的数字、标点符号、段落符号、英文缩写等,剔除与中文词频分析无关的因素;接着将全部处理好的文本保存到文本文章中,用ROST CM6软件进行内容分析【6】。

    3.3 高频特征词提取

        首先要建立一个自定义词表,接着导入待分析的文本,使用ROST CM6软件的分词功能,将所有文本进行处理,将语句分解成独立的词语。为提高文本分析的精确性,必须对文本进行分词处理后的结果进行检查,修正那些分词不正确,甚至错误的词。在此基础上利用软件“分词过滤词表”再建立一个过滤词表,过滤掉与本研究内容无关的词汇,使用“词频分析”功能生成词汇频数表。

  1. 上一篇:泰州市中南部美食旅游资源现状及开发对策
  2. 下一篇:旅游法背景下的旅行社经营分析
  1. 5W1H“谷度酒庄”淘宝店的营销策略分析

  2. 淘宝网店“妖精的口袋”网络营销策略分析

  3. 公共政策宣传方式研究民...

  4. 网络对消费模式的影响“...

  5. 大学生“中性化”问题研究

  6. 淮安市“中南世纪城”市...

  7. “80后”员工低感情承诺的工作价值观分析

  8. 十二层带中心支撑钢结构...

  9. 当代大学生慈善意识研究+文献综述

  10. java+mysql车辆管理系统的设计+源代码

  11. 河岸冲刷和泥沙淤积的监测国内外研究现状

  12. 乳业同业并购式全产业链...

  13. 酸性水汽提装置总汽提塔设计+CAD图纸

  14. 电站锅炉暖风器设计任务书

  15. 中考体育项目与体育教学合理结合的研究

  16. 大众媒体对公共政策制定的影响

  17. 杂拟谷盗体内共生菌沃尔...

  

About

751论文网手机版...

主页:http://www.751com.cn

关闭返回