在实现短时兴趣模型的过程中可能会涉及到的,诸如有关网络社区优化算法的问题,经过查阅资料之后,我们发现网络优化这一领域自03年起已经发展得较为成熟,可在构建完成的兴趣网络上直接运用前人所提出的算法。最后是如何构建一个可靠性较强的兴趣网络图这一问题,对此,关键是要想办法准确的提取出用户输入内容的关键信息,为此,我们找到了实用性比较高的NLPIR汉语分词系统,再结合 “知网”现有的语义词典,问题便也可迎刃而解了。
2.3.2 经济可行性
当下,虽然很多的搜索公司已经做出了较为完善的搜索引擎系统,但大多都是以用户长时兴趣模型作为基础,对短时用户兴趣模型的研究尚还存在一些不足,许多公司也意识到了这一点,对短时用户兴趣模型这一块的研究比较感兴趣,纷纷做出了投资。但是,现在的短时用户兴趣模型还在起步阶段,成熟的模型还是很少。相信随着时间的推进,这方面模型的投资和研究也会越来越大,最后找到和长时兴趣模型想契合的点,搭配共同使用。
3 总体设计
3.1 系统功能模块设计
参考需求分析,此课题基于短时用户兴趣模型最终设计了三种不同的搜索方式,分别是百度搜索,兴趣搜索和社区搜索。
图3.1 系统级模块图
(1) 百度搜索:基于百度搜索引擎制作,包括执行搜索,显示从百度搜索引擎中获得的搜索结果。
(2) 兴趣搜索:在百度搜索的基础上,引入了短时用户兴趣模型,增加了兴趣扩展,构建兴趣网络,结果过滤等功能。
(3) 社区搜索:在兴趣搜索的基础上,改进了短时用户兴趣模型,增加了包括兴趣网络优化在内的一些功能。
3.1.1 百度搜索
图3.2 百度搜索模块图
(1) 数据采集模块:根据用户的搜索内容,模拟百度搜索进行执索,采集百度搜索结果数据,存入数据库。
(2) 显示模块:获得在百度中搜索得到的结果,向用户展示。
3.1.2 兴趣搜索
图3.3 兴趣搜索模块图
(1) 关键词分析模块:提出用户搜索内容当中的关键词,并对之进行分析。
(2) 兴趣扩展模块:对用户的搜索内容进行兴趣网络内部扩展或者外部资料扩展。
(3) 数据采集模块:对兴趣扩展后的内容,模拟百度搜索进行执索,采集百度搜索结果数据,存入数据库。
(4) 网络构建模块:根据用户输入的内容,提取用户兴趣,构建用户短时兴趣网络
(5) 结果优化模块:抓取在百度中搜索得到的结果,对结果进行优化。
(6) 显示模块:把优化后的结果在界面中向用户显示。来`自^751论*文-网www.751com.cn
3.1.3 社区搜索
图3.4 社区搜索模块图
(1) 关键词分析模块:提出用户搜索内容当中的关键词,并对之进行分析。
(2) 兴趣扩展模块:对用户的搜索内容进行社区网络内部扩展或者外部资料扩展。