4.2.2 搜索索引 17
4.2.3 基于SQL的搜索 19
第五章 功能演示 21
5.1 搜索功能演示 21
5.2 总结 22
结束语 23
致 谢 24
参考文献 25
第一章 绪论
1.1 基于Lucene的站内搜索引擎的背景
随着信息爆炸时代的来临,互联网上充斥着各种各样的信息。哪怕仅仅只是一个新闻发布网站,每天都要新增许许多多的新闻。随着新闻的不断累积,数据库中文新闻数量也以指数型增长,简单的搜索语句所耗费的时间也令人瞠目结舌。搜索数据的时间过长,影响用户的体验,对网站的使用程度也会大大减少。所以,如何高效快速地对数据库中的数据进行检索成了许许多多内容管理系统需要考虑的事情。
除了对搜索速度的要求外,对用户输入的词句分析一大难题。由于用户在知识水平,语言体系以及描述水平上的不同,对于同一件的事情的上的描述也是各有不同。在英语中,对于一句话尽心分析,只需要对空格进行拆分,将拆分的每一个单词进行查找即可。但是由于中文语法的特殊性,一句话可以有多种表达方法,由于切词的位置不同,也会产生不一样的词义与句义。由此可以看出,一个好的分词方法也为搜索引擎提供了非常巨大的帮助。
1.2 基于Lucene的站内搜索引擎的目的与意义
1.2.1 基于Lucene的站内搜索引擎的目的
在当下许多网站当中,用户如果希望查找该网站某一条具体的新闻,需要在网站的历史记录一一进行排查,既花费了大量的时间,还需要用户对新闻的标题或者时间有相对应的记忆,而且还不一定可以查找的对应的内容,偶尔的晃神也可能与所查找新闻擦肩而过。所以站内搜索引擎也就应运而生。使用站内搜索引擎的目的就是为了更加快速、准确、智能的搜索出用户所需要的数据,提升网站的用户体验,让网站在众多的内容管理系统网站中脱颖而出。
1.2.2 基于Lucene的站内搜索引擎的意义
使用站内搜索引擎,可以增加网站的用户体验,使用户快速准确地获取想要的数据。用户在体验到高速搜索数据之后,对于耗时耗力地缓慢搜索会产生抗拒与厌烦,使得有站内搜索引擎的网站可以在同类型网站中慢慢凸显出来,即使别的网站在之后也加入了站内搜索引擎,在同等数据库时,用户会更加习惯使用一开始所使用的网站,给该网站带来了稳定的网站的访问量。
1.2.3 基于Lucene的站内搜索引擎的研究方法
该课题所采用的研究方法主要有:网络搜索法、文本文献研究法以及实践研究法。网络搜索法主要是通过互联网搜索有关于该课题的所需要的资料,通过在互联网上进行提问的方法来解决自己在实践过程中所遇到的问题,来实现站内搜索引擎。文本文献研究法主要是通过对已经出版的杂志、报刊、书籍等进行阅读理解,了解有关于Lucene和站内搜索引擎相关领域的技术以及作者对其的理解与用法。通过网络搜索法和文本文献研究法将所获取的资料与实际项目进行结合,应用到实际的内容管理系统网站上,经过不断地优化、改善、修改调整之后,完成一个较为实用,符合网站要求的站内搜索引擎。
第二章 开发环境、语言和相关技术介绍
2.1 .NET开发平台介绍
.NET框架是由微软(Microsoft)开发的一个多语言组件的开发和执行环境,是一个致力于敏捷软件开发、快速应用开发以及平台无关性和网络透明化的软件程序开发平台。它是一个跨越编程语言的集成开发环境。.NET框架构成的主要作用是为了使软件开发工程师更加方便快捷的地开发Web应用程序和Web服务,通过相关的Web服务就可让因特网上应用程序相互通信了。从应用软件开发的层次结构上来看,.NET框架包含三个主要的层次结构:公共语言运行时(CLR:Common Language Runtime)、服务框架(Services Framework)以及上层的两类应用模板——使用ADO.NET开发的Windows应用程序(WinForms)和使用ASP.NET开发的Web应用程序(WebServices和WebForms) 基于Lucene的站内搜索引擎设计+源代码(2):http://www.751com.cn/jisuanji/lunwen_48004.html