admin 发表于 2016-5-7 22:40:24

基于Lucene的图书搜索引擎

技术:Java、JSP等
摘要:
随着互联网的迅速发展,网络上的信息量也在迅速膨胀,在这海量的信息中,用户面对成千上万的搜索结果进行逐一浏览是不可能的。因此搜索引擎成为了人们筛选信息的首选工具。然而判断一个搜索引擎性能的好坏并不在于其能否找到所有的信息,而是在于搜索的准确性和速度。
在查询过程中,用户的查询内容既包括西文也包括中文,中文与西文不同,西方文字以词为单位,单词间有空格作为分隔,计算机很容易把词分开。而中文是以字为单位,句子中所有的字连起来才能描述一个意思。因此要把中文句子拆分成词就需要使用中文分词技术。
由于中文的复杂性,所以中文分词算的研究与应用就变得很有必要了。该项目是基于Lucene的图书搜索引擎通过对关键字的查询,完成对MM中文分词算法的研究。论文首先介绍了本项目的相关知识背景,简述Lucene,然后阐述了数据库设计,最后说明了系统的具体实现过程 。本系统开发工具是MyEclipse和SQL Server。

关键词:Lucene,搜索引擎

目录:
1引言    1
1.1中文分词的研究背景    1
1.2中文分词的研究意义    1
2系统简介    2
2.1项目名称    2
2.2 开发工具    2
2.2.1 开发工具简介    2
2.3搜索引擎简介    3
2.4相关技术简介    3
2.4.1Java简介    3
2.4.2Hibernate简介    3
2.4.3Struts简介    4
2.4.4JSP简介    4
2.4.5Lucene简介    5
3系统设计    7
3.1   系统实现流程图    7
3.2系统顺序图    7
3.3系统状态图    7
3.4数据库设计    8
3.4.1数据库设计    8
3.4.2数据连接    9
3.5索引设计    10
3.5.1解析器设计    10
3.5.2分析器设计    10
3.5.3索引建立    13
3.6搜索设计    13
4系统测试    15
4.1软件测试    15
4.2系统测试的方法    16
4.3测试用例以及运行结果    16
5总结    21
5.1本文所做的主要工作    21
5.2未来工作    21
参 考 文 献    23
致谢    25

包含资料:


截图:




百度网盘下载地址(金币充值):
**** 本内容需购买 ****


页: [1]
查看完整版本: 基于Lucene的图书搜索引擎