基于Lucene的图书搜索引擎
技术:Java、JSP等摘要:
随着互联网的迅速发展,网络上的信息量也在迅速膨胀,在这海量的信息中,用户面对成千上万的搜索结果进行逐一浏览是不可能的。因此搜索引擎成为了人们筛选信息的首选工具。然而判断一个搜索引擎性能的好坏并不在于其能否找到所有的信息,而是在于搜索的准确性和速度。
在查询过程中,用户的查询内容既包括西文也包括中文,中文与西文不同,西方文字以词为单位,单词间有空格作为分隔,计算机很容易把词分开。而中文是以字为单位,句子中所有的字连起来才能描述一个意思。因此要把中文句子拆分成词就需要使用中文分词技术。
由于中文的复杂性,所以中文分词算的研究与应用就变得很有必要了。该项目是基于Lucene的图书搜索引擎通过对关键字的查询,完成对MM中文分词算法的研究。论文首先介绍了本项目的相关知识背景,简述Lucene,然后阐述了数据库设计,最后说明了系统的具体实现过程 。本系统开发工具是MyEclipse和SQL Server。
关键词:Lucene,搜索引擎
目录:
1引言 1
1.1中文分词的研究背景 1
1.2中文分词的研究意义 1
2系统简介 2
2.1项目名称 2
2.2 开发工具 2
2.2.1 开发工具简介 2
2.3搜索引擎简介 3
2.4相关技术简介 3
2.4.1Java简介 3
2.4.2Hibernate简介 3
2.4.3Struts简介 4
2.4.4JSP简介 4
2.4.5Lucene简介 5
3系统设计 7
3.1 系统实现流程图 7
3.2系统顺序图 7
3.3系统状态图 7
3.4数据库设计 8
3.4.1数据库设计 8
3.4.2数据连接 9
3.5索引设计 10
3.5.1解析器设计 10
3.5.2分析器设计 10
3.5.3索引建立 13
3.6搜索设计 13
4系统测试 15
4.1软件测试 15
4.2系统测试的方法 16
4.3测试用例以及运行结果 16
5总结 21
5.1本文所做的主要工作 21
5.2未来工作 21
参 考 文 献 23
致谢 25
包含资料:
截图:
百度网盘下载地址(金币充值):
**** 本内容需购买 ****
页:
[1]