菜单
  

    第三章:最大匹配算法。介绍最大匹配算法的原理,并展示应用字典进行最大匹配算法的分词结果。
    第四章:最大匹配扩展算法。介绍最大匹配扩展算法的原理,并展示扩展算法的分词结果。
    第五章:最大匹配算法与扩展算法的比较。应用同一个字典,比较最大匹配算法与扩展算法的分词结果。
    第751章:汉字编码。论述在实现算法过程中遇到的汉字编码问题,同时介绍相关的汉字编码知识。
    2  中文词典收集
    2.1  词典简介
    生活中大家常用字典,字典是用来收录单词的,也可称为词典。在基于字典的中文分词技术里,字典存储着大量的中文单词,基于字典的分词上面已经解释过,就是通过查询字典中的单词将中文语料切分出一个一个词语的过程。在分词处理的过程中,不同的算法用到不一样的字典,相应的,字典也有多种格式。由于本次论文讨论的算法是基于字典的,字典的格式以及收录的单词数量,直接关系着分词结果的好坏。对于一个只收录了1000个单词的字典和收录了10万个单词的词典,运用它们对语料进行分词的结果肯定是天壤之别。同时字典中收录的单词数量较多,整理的过程也是比较繁琐的,因此在本次毕业设计中,对于字典的收集和整理也是本次实验的一个重要环节。
  1. 上一篇:php+mysql装修公司施工管理系统的设计
  2. 下一篇:结合自适应图像片与图割的交互式图像分割算法研究
  1. 基于MATLAB的图像增强算法设计

  2. 基于Kinect的手势跟踪与识别算法设计

  3. JAVA基于安卓平台的医疗护工管理系统设计

  4. 基于核独立元分析的非线...

  5. 基于Hadoop的制造过程大数据存储平台构建

  6. 基于安卓系统的测量软件...

  7. 基于VC++的GIS矢量图形系统开发

  8. 酸性水汽提装置总汽提塔设计+CAD图纸

  9. 杂拟谷盗体内共生菌沃尔...

  10. 十二层带中心支撑钢结构...

  11. 乳业同业并购式全产业链...

  12. 河岸冲刷和泥沙淤积的监测国内外研究现状

  13. 中考体育项目与体育教学合理结合的研究

  14. 当代大学生慈善意识研究+文献综述

  15. 大众媒体对公共政策制定的影响

  16. 电站锅炉暖风器设计任务书

  17. java+mysql车辆管理系统的设计+源代码

  

About

751论文网手机版...

主页:http://www.751com.cn

关闭返回