4.2 中文分词的实现 24
4.3 关键字匹配 32
结 论 34
致 谢 35
参考文献 36
1.1 选题的背景和意义
计算机的普及以及网络技术的飞速发展,给人们的生活方式带来了巨大的变化。在教学过程中,互联网正在发挥着越来越重要的作用,影响了教学的方法和手段,使得传统单一的师生面对面的教学方式逐渐迈向网络化、信息化。网络教学,从广义上来讲,指的是以网络作为教学的平台,将网络技术作为学习环境的构成因素,以学生为主体,以自主探究为主要学习方式的教学活动。与传统教育方式相比,网络教学具有开放性、灵活性、交互性和分散性的特点,它打破了传统的单一的封闭的教学模式,使得学生不受时间地域的限制,可以在任何时间、任何地点,学习任何一位老师开设的课程,并与能与老师同学交流。
在教学过程中,学生不可避免地会遇到一些疑问,为了方便学生与教师沟通,尽快解决疑问,网络答疑系统便应运而生。以往的网络答疑系统大都采用人工答疑的方式,利用聊天工具,或留言板,甚至是发送电子邮件的方式供教师和学生交流问题。人工答疑最大的缺点是实时性差,学生难以及时得到答案,而且由于学生数量众多,也加大了教师的负担。为了解决这些问题,智能答疑系统成为了一种更好的方案。智能答疑系统能够根据学生提出的问题自动进行分析,提取关键字,对比数据库中以往的知识,找到相同或相似的问题,将其答案反馈给提问的学生,学生无需等待教师的回答,能够立即得到答案或者相关的信息,也减轻了教师的负担。在智能答疑系统中,最主要的就是对学生的提问进行准确的分析,因此,自然语言的处理成为影响答疑效果的关键因素。要处理好中文文本语言,首先需要解决中文分词问题,即将完整的句子分割成有意义的词语和单字的序列,方便计算机对文本进一步处理。分词效果的好坏决定了后续文本处理的好坏。因此,中文分词成为了中文智能答疑系统的一项基本技术。
在国外,尤其是西语国家,已经有独立运行的智能答疑系统,不依附于任何教学平台而存在,在基于自然语言的提问方面已做得相当成熟,十分人性化。但中文和西方语言不同,虽然西方语言的处理也面临短语等划分的问题,但就词而言,中文的词和词之间不像英文一样存在明确的边界,所以中文的分词比英文要复杂,难以被计算机理解,这使得国内的智能答疑系统在准确性和人性化方面与西语国家已有的智能答疑系统相比还有一定差距,无论是答疑的实时性还是准确性效果都不是很理想。智能答疑系统的智能化是建立在对语言文字的准确分析之上的,只有对提问进行准确的分析,提取正确的关键词,才能得正确的答案。
对中文分词技术的研究历时已久,各类学者也提出了多种方案,但由于语言本身的不断发展以及在不同应用领域对分词要求的不同,智能答疑系统中的中文分词技术还需进一步的改善。目前的答疑系统每次分词都要对问题进行大量的匹配计算,影响了分词的速度,对专业性强的问题又不能够有效地分词,这些都导致了答疑系统所给出的答案不够精确,极大地限制了智能答疑系统的实用性,也影响了网络教学平台的性能。