摘 要:Lucene.Net是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。本篇毕业论文对搜索引擎的原理、组成、数据结构、工作流程等方面做了深入地研究与分析。并且通过Lucene.Net来设计和实现一个全文检索站内搜索引擎系统,最后通过增量索引和优化索引两个方面来说明怎么样来提高Lucene.Net的高效性。19057
关键词:Lucene.Net;全文检索;搜索引擎
Design of Search Engine Based on Lucene.Net
Abstract:Lucene.Net is a full-text search engine framework, which provides a complete query engine and index engine. A deep research and analysis has been made in this thesis about the search engine's principle, composition, data structure, work flow and other aspects. And through the Lucene, a full-text retrieval search engine system can be designed and implemented through Lucene.Net, finally through the two aspects of the increment index and the optimization index, this paper will illustrate how to improve the efficiency of Lucene.Net.
Key Words:Lucene.Net; Full-text search; Search engine
目 录
摘 要: 3
引言 3
1.课题现状及研究背景 4
1.1 Lucene.Net概述 4
1.2课题背景及意义 5
1.3课题目前研究情况及存在问题 5
2.系统相关技术 6
2.1中文分词 6
2.2盘古分词 6
3.全文检索过程 7
3.1索引 7
3.2搜索 8
4.系统分析 9
4.1需求分析 9
4.2开发工具与环境 9
5.系统实现 9
5.1 Lucene.Net核心类简介 9
5.2模块功能的实现 10
5.3 搜索功能的实现 11
5.4 索引管理的实现 11
6.系统测试 11
6.1数据库连接 12
6.2功能测试 12
7.总结 12
参考文献 14
致谢 15
基于Lucene.Net的站内搜索引擎的设计 引言
搜索引擎在当今的网络资源应用中扮演着非常重要的角色,从Baidu和Google的业绩强势增长的趋势也可以看到这方面。有了搜索引擎,网络资源得以集中地管理和分类,从而使用户不用直接去网络上毫无目的去寻找自己所需要的信息。但是随着科学技术的发展,人们逐渐地发现现在的搜索引擎并不能满足自己的个性化需求,大众的搜索引擎也很难实现一个域范围内全面快速的搜索。比如说,在一个淘宝网站搜索,大众的搜索引擎就不可能提供淘宝网所有网页这一特定范围的搜索功能,并且实现快速更新。
1.课题现状及研究背景
1.1 Lucene.Net概述
Lucene.Net并不是一个独立的开源项目,而是Lucene的.Net移植版本,即是一个开源的全文检索引擎开发包。目的是能够在.Net环境下使用,现在通过各个部分改写C#下的Lucene.Net已经到了一个非常成熟的阶段。为许多的.Net开发人员提供了更进一步研究搜索引擎的平台。组成结构表如表1所示。
表1 Lucene.Net结构功能表
程序集名 功能
Lucene.Net.Analysis 语言分析器
Lucene.Net.Documents 索引存储是的文档结构管理,类似于关系型数据库的表结构
Lucene.Net.Index 索引管理,包括索引库的建立删除等
Lucene.Net.QueryParsers 查询分析器,实现查询关键词间的运算
Lucene.Net.Search 检索管理,根据条件查询得到结果 基于Lucene.Net的站内搜索引擎的设计:http://www.751com.cn/jisuanji/lunwen_10257.html