菜单
第三章:最大匹配算法。介绍最大匹配算法的原理,并展示应用字典进行最大匹配算法的分词结果。
第四章:最大匹配扩展算法。介绍最大匹配扩展算法的原理,并展示扩展算法的分词结果。
第五章:最大匹配算法与扩展算法的比较。应用同一个字典,比较最大匹配算法与扩展算法的分词结果。
第751章:汉字编码。论述在实现算法过程中遇到的汉字编码问题,同时介绍相关的汉字编码知识。
2 中文词典收集
2.1 词典简介
生活中大家常用字典,字典是用来收录单词的,也可称为词典。在基于字典的中文分词技术里,字典存储着大量的中文单词,基于字典的分词上面已经解释过,就是通过查询字典中的单词将中文语料切分出一个一个词语的过程。在分词处理的过程中,不同的算法用到不一样的字典,相应的,字典也有多种格式。由于本次论文讨论的算法是基于字典的,字典的格式以及收录的单词数量,直接关系着分词结果的好坏。对于一个只收录了1000个单词的字典和收录了10万个单词的词典,运用它们对语料进行分词的结果肯定是天壤之别。同时字典中收录的单词数量较多,整理的过程也是比较繁琐的,因此在本次毕业设计中,对于字典的收集和整理也是本次实验的一个重要环节。
共3页:
上一页
1
2
3
下一页
上一篇:
php+mysql装修公司施工管理系统的设计
下一篇:
结合自适应图像片与图割的交互式图像分割算法研究
基于MATLAB的图像增强算法设计
基于Kinect的手势跟踪与识别算法设计
JAVA基于安卓平台的医疗护工管理系统设计
基于核独立元分析的非线...
基于Hadoop的制造过程大数据存储平台构建
基于安卓系统的测量软件...
基于VC++的GIS矢量图形系统开发
酸性水汽提装置总汽提塔设计+CAD图纸
杂拟谷盗体内共生菌沃尔...
十二层带中心支撑钢结构...
乳业同业并购式全产业链...
河岸冲刷和泥沙淤积的监测国内外研究现状
中考体育项目与体育教学合理结合的研究
当代大学生慈善意识研究+文献综述
大众媒体对公共政策制定的影响
电站锅炉暖风器设计任务书
java+mysql车辆管理系统的设计+源代码
主页
计算机
机械
自动化
关闭菜单
栏目
毕业论文
计算机论文
经济论文
生物论文
数学论文
物理论文
机械论文
新闻传播论文
音乐舞蹈论文
法学论文
文学论文
材料科学
日语论文
英语论文
化学论文
自动化
管理论文
艺术论文
会计论文
土木工程
电子通信
食品科学
教学论文
医学论文
体育论文
论文下载
研究现状
任务书
开题报告
外文文献翻译
文献综述
范文
菜单
毕业论文
刷新
分享
收藏
关于
关闭
关闭
分享本页
返回
关闭
暂无收藏
全部清除
关闭菜单
About
751论文网手机版...
主页:
http://www.751com.cn
关闭
返回