职场大变样社区

标题: 音乐搜索引擎的设计与实现 [打印本页]

作者: admin    时间: 2018-2-25 16:09
标题: 音乐搜索引擎的设计与实现
技术:Java、JSP等
摘要:
随着互联网的普及,搜索引擎在中国异军突起,并且日益渗透到人们的日常生活中,在互联网普及之前,人们查询资料首先想到的是拥有大量书籍的图书馆。但今天很多人都会选择一种更方便、快捷、全面、准确的查阅方式--互联网。而越来越被重视的搜索引擎帮助我们在整个互联网上快速地查找到目标信息。对于文本内容的搜索已有非常成熟的技术,而对于多媒体内容的搜索,人们还在积极的探索之中。
本文的工作是研究并开发了多媒体信息中的音乐信息的搜索引擎系统。该系统提供了搜索音乐的途径,就是传统的按文本属性(如歌曲名,歌手,专辑)的搜索。
该系统的开发采用了一个用Java写的全文搜索引擎工具包Lucene,Lucene具有良好的开放性和易扩展性,应用它可以快速开发一个搜索引擎。
对于该搜索引擎搜索的数据,该系统设计了一个基于WebCollector的网络爬虫,通过该网络爬虫,抓取网络上的数据。WebCollector是不需要配置,并且便于二次开发的Java爬虫框架,用户可以在其基础上开发自己想要的爬虫。
该系统还设计了简洁美观的搜索界面,增强用户的搜索体验。
关键字:搜索引擎;音乐;Luence;网络爬虫

目录:
摘   要    I
Abstract    II
1.  绪论    1
1.1  课题背景    1
1.2  研究现状    1
1.2.1  国内搜索引擎现状    2
1.2.2  国外搜索引擎现状    3
1.3  本章小结    4
2.  系统技术分析    5
2.1  搜索引擎概述    5
2.1.1  爬行和抓取    6
2.1.2  建立索引    6
2.1.3  搜索词处理    7
2.2  B/S结构    7
2.3  Servlet 的原理    8
2.4  WebCollector    9
2.4.1  WebCollector简介    9
2.4.2  WebCollector架构图    10
2.5  Lucene    11
2.5.1  Lucene简介    11
2.5.2  Lucene系统结构    13
2.6  CSS    14
2.7  本章小结    15
3.  系统总体设计    16
3.1  系统总体架构图    16
3.2  系统分支模块架构图    16
3.2.1  网络爬虫模块架构图    16
3.2.2  索引模块架构图    17
3.2.3  检索模块架构图    18
3.3  本章小结    22
4.  系统详细设计    23
4.1  网络爬虫模块    23
4.1.1  种子站点的选择方案    23
4.1.2  网页信息的提取    23
4.1.3  链接的过滤    23
4.2  索引模块的设计    24
4.2.1  索引建立    24
4.2.2  分词    25
4.3  检索模块的设计    25
4.3.1  Lucene的查询接口    25
4.4  用户界面设计    25
4.5  本章小结    27
5.  系统实现    29
5.1  网络爬虫的实现    29
5.2  索引建立的实现    31
5.3  检索模块的实现    33
5.4  本章小结    34
6.  系统测试    35
6.1  网络爬虫测试    35
6.2  搜索引擎测试    35
6.3  本章小结    39
结束语    40
参考文献    41
致 谢    42
附录A 外文原文    43
附录B中文翻译    55

论文字数:34663
包含资料:


截图:



百度网盘下载地址(金币充值):
[sell=200,2][/sell]







欢迎光临 职场大变样社区 (http://zcdby.com/) Powered by Discuz! X3.2