菜单
  

    随着互联网技术的迅速发展和普及,大量的文字信息开始以计算机可读的形式存在,并且其数量每天都在急剧增加,人们已经从信息缺乏时代过渡到了信息极大丰富的时代。如何对浩如烟海的文献,和资料和数据(很大一部分是文本)进行自动分类,组织和管理,已经成为一个具有重要用途的研究课题。59672

    文本自动分类简称文本分类(text categorization),是模式识别与自然语言处理密切结合的研究课题。本文主要做了2个实验:

    1. 第一个实验是对宾馆和笔记本语料的使用不同权重和不同特征选择下的实验,实验中使用的权重有布尔权重(BOOL),绝对词频(TF),TFIDF等3种方法,特征选择有文档频数(DF),信息增益(IG), (CHI)等3种方法,分类器使用的是支持向量机模型(SVM)。 实验结果显示:在不同特征选择下使用布尔权重(BOOL)时的正确率最高,3种特征选择的正确率基本相同。

    2. 第二个实验是对宾馆和笔记本语料进行否定转移后,按第一个实验方法进行实验。否定转移前后实验结果上可以看出:正确率有了大约1%的提高。说明否定转移是文本分类中起到重要作用。

    毕业论文关键字  文本分类  权重  特征选择  否定转移

    毕业设计说明书(论文)外文摘要

    Title Development and research of sentiment text classification system

    Abstract

       With the rapid development and popularization of Internet technology, a large number of text information began to exist in machine-read form, and the number is increasing every day, it has been from the lack of information to the era of a large   amount of information. How the multitude of literature, and the information and data (a large part of text), organization and management, has become a very important   research.

       Automatic text categorization also said text classification (text categorization), is a research topic closely combined with pattern recognition and natural language processing. This text article mainly did 2 experiments:

    1. the first experiment is using different term-weight and feature selection in the hotel and notebook review, the methods of term-weight is BOOL, TF, TFIDF and other 3 kinds of methods of feature selection is document frequency (DF), information gain (IG), CHI 3 methods, classifiers are using support vector machine model (SVM). The results show: using BOOL term-weight under the different feature selection have the highest result, 3 feature selections have same result.

    2. the second experiment was negative inversion of the hotel and notebook reviews, the tests were conducted according to the first experiment method. Negative inversion and the experimental results can be seen: the correct rate is about 1% of the increase. That negative inversion is play an important role in text classification.

     Keywords  text classification, term weight, feature selection,  negative inversion

    目录

    1 引言 1

    1.1 课题背景 1

    1.2 课题研究的目的及意义 1

    1.3 国内外相关技术发展现状 2

    1.3.1 观点文本分类的主要研究内容 2

    1.3.2 观点文本分类的应用现状

  1. 上一篇:Android手机RSS阅读器的设计
  2. 下一篇:严格奇异算子及其应用
  1. 计算机音乐分类辨识研究

  2. 高光谱数据稀疏约束分类识别技术研究

  3. 网络新闻文本中的命名实体自动抽取研究

  4. K-means聚类算法和cure算法学生成绩分类

  5. Android手机短信分类设计与实现

  6. K-means算法WEB文本挖掘中的聚类研究

  7. 面向新闻同步的网站内容自动提取与分类研究

  8. 酸性水汽提装置总汽提塔设计+CAD图纸

  9. java+mysql车辆管理系统的设计+源代码

  10. 杂拟谷盗体内共生菌沃尔...

  11. 乳业同业并购式全产业链...

  12. 中考体育项目与体育教学合理结合的研究

  13. 电站锅炉暖风器设计任务书

  14. 大众媒体对公共政策制定的影响

  15. 十二层带中心支撑钢结构...

  16. 当代大学生慈善意识研究+文献综述

  17. 河岸冲刷和泥沙淤积的监测国内外研究现状

  

About

751论文网手机版...

主页:http://www.751com.cn

关闭返回