面向主题的搜索引擎的设计与实现
技术:Java等摘要:
Internet已经成为目前世界上最大的信息资源库,但是网上信息资源纷繁芜杂,如何满足人们对快速、准确而全面获取信息的要求,已经成为摆在人们面前的一大难题。基于Internet的各类搜索引擎应运而生并得到了迅速发展。面向主题的搜索引擎是一种分类细致精确、更新及时的搜索引擎。随着Internet信息的爆炸增长以及信息多元化的发展,主题搜索引擎正成为研究热点与发展趋势。
本课题就面向主题搜索引擎的关键技术进行了研究,并提出了一种基于Lucene的面向主题搜索引擎的解决方案。在本课题的条件下提出了面向服装主题的搜索引擎的设计思想、系统结构、搜索策略和搜索方式等。
系统的实现技术主要是按照后台和前台来分的,在后台的设计中主要应用的技术有Luence和Heritrix;在前台的设计中主要是使用了MVC(Model View Controller)的设计模式和Struts框架以及Hibernate等技术。
关键词:搜索引擎;主题;Luence
目录:
引 言 1
第一章 面向主题搜索引擎概述 2
1.1 搜索引擎的概念和发展现状 2
1.2 面向主题搜索引擎的发展趋势 2
1.3 小结 3
第二章 面向服装行业搜索引擎的简介 4
2.1 设计思想 4
2.2 系统体系结构和流程 4
2.3 小结 6
第三章 系统涉及的相关技术以及功能需求 7
3.1 系统设计的相关技术 7
3.1.1 Luence索引的建立 7
3.1.2 网络爬虫技术 9
3.1.3 解析网页技术 10
3.2 系统功能需求 10
3.2.1 网页信息抓取模块 12
3.2.2 网页解析模块 12
3.2.3 建立索引模块 13
3.2.4 关键词词库过滤模块 13
3.2.5 用户接口模块 13
3.3 小结 14
第四章 系统数据库设计和详细设计 15
4.1 数据库设计 15
4.1.1 数据库需求分析 15
4.1.2 数据字典 15
4.1.3 数据库模型设计 16
4.2 系统详细设计 17
4.2.1 网络爬虫流程设计 17
4.2.2 解析Html文件 18
4.2.3 创建索引 19
4.2.4 使用关键词词库过滤索引文件 19
4.2.5 网站前端设计 20
4.2 小结 22
第五章 系统实现 23
5.1 系统功能实现 23
5.1.1 系统后台功能实现 23
5.1.2 系统前台功能实现 24
5.2 小结 26
结论 27
参考文献 28
谢辞 29
包含资料:
截图:
百度网盘下载地址(金币充值):
**** 本内容需购买 ****
页:
[1]