通过对于搜索引擎方面技术的学习,发现这个决策是可行的,原因如下:源:自~751·论`文'网·www.751com.cn/
1. 技术成熟。经过了多年发展,搜索引擎方面的理论知识以及时间技术已经颇为成熟,这保证了技术实现的可行性。
2. 开发简单。较为成熟的Lucene开发包有十分简单容易上手的API及接口,大大降低了开发的难度。
3. 硬件要求不高。基于分布式的设计,只需要若干台普通的计算机就可以保证系统流畅运行。
2.2 系统设计图
论文旨在建立一个小型的搜索引擎,用于企业对于自身数据库中的产品及服务的索引搜索功能,并呈现给用户浏览。通过对于通用搜索引擎的学习,并进行一定的改变来完成对于小型搜索引擎的设计。
目前的通用搜索引擎主要以爬行抓取网页数据、建立索引、搜索词处理、排序、检索为主要步骤
基于Hadoop平台的文档检索技术研究与实现(3):http://www.751com.cn/jisuanji/lunwen_72094.html