搜索引擎的系统体系结构的研究与应用
技术:Java等摘要:
近年来,互联网上的信息呈几何级数爆炸性增长,丰富多彩的网络资源给人们的生活工作以及学习带来巨大方便的同时,信息的浩繁,庞杂无序和动态性又极大地影响了用户获取信息的速度,准确性和有效性。海量的存贮和科学的信息搜索是用户信息行为中两种重要的能力,互联网的发展已经实现了信息的海量存贮,为了解决大海捞针似的信息搜索问题,搜索引擎便应运而生了。目前搜索引擎技术已成为计算机工业界和学术界争相研究和开发的热点技术。
对于实现网络信息的海量搜索,搜索引擎的体系结构设计成为提高搜索效率的关键。本文中所设计的搜索引擎,主要有四个大的模块组成:一是抓取模块:实现了对网页信息的下载。二是索引模块:实现了对网页信息的排序,索引。三是搜索模块:实现了对网页信息的快速检索。四是用户接口:实现了系统的前台操作。
本系统是对网站数据及相关数据库数据进行搜索,管理配置了对应数据源和搜索途径,实现了对网络信息的快速搜索。
关键词:搜索引擎;体系结构;索引
目录:
引 言 1
第一章 搜索引擎的系统结构 2
1.1 结构概述 2
1.2 搜索引擎的的构成 2
1.2.1 网络机器人 2
1.2.2 索引与搜索 2
1.2.3 Web服务器 2
1.3 搜索引擎的主要指标及分析 2
第二章 系统设计的相关知识介绍 4
2.1 Lucene2.0简介 4
2.1.1 Lucene2.0的原理 4
2.1.2 Lucene2.0的优越性 4
2.2 JSP简介 5
2.2.1 JSP的运作模式 5
2.2.2 JSP的优点 5
2.3 JDBC简介 6
第三章 系统需求分析 8
3.1 编写目的 8
3.2 项目背景 8
3.3 任务概述 8
3.3.1 目标 8
3.3.2 运行环境 8
3.4 系统功能需求 8
3.4.1 网页抓取模块 9
3.4.2 索引模块 9
3.4.3 搜索 9
3.4.4 用户接口模块 10
第四章 系统详细设计 11
4.1 数据库设计 11
4.1.1 数据库需求分析 11
4.1.2 数据字典 11
4.2 系统设计 12
4.2.1 网页抓取 12
4.2.2 建立索引 13
4.2.3 搜索 14
4.2.4 前台设计 15
第五章 系统的实现 16
5.1 系统的实现 16
5.2 搜索测试 17
5.2.1 域名搜索测试 17
5.2.2 页面索引测试 18
5.3 重建数据库功能 20
结论 21
参考文献 22
谢辞 23
包含资料:
截图:
百度网盘下载地址(金币充值):
**** 本内容需购买 ****
页:
[1]