admin 发表于 2018-2-25 16:09:12

音乐搜索引擎的设计与实现

技术:Java、JSP等
摘要:
随着互联网的普及,搜索引擎在中国异军突起,并且日益渗透到人们的日常生活中,在互联网普及之前,人们查询资料首先想到的是拥有大量书籍的图书馆。但今天很多人都会选择一种更方便、快捷、全面、准确的查阅方式--互联网。而越来越被重视的搜索引擎帮助我们在整个互联网上快速地查找到目标信息。对于文本内容的搜索已有非常成熟的技术,而对于多媒体内容的搜索,人们还在积极的探索之中。
本文的工作是研究并开发了多媒体信息中的音乐信息的搜索引擎系统。该系统提供了搜索音乐的途径,就是传统的按文本属性(如歌曲名,歌手,专辑)的搜索。
该系统的开发采用了一个用Java写的全文搜索引擎工具包Lucene,Lucene具有良好的开放性和易扩展性,应用它可以快速开发一个搜索引擎。
对于该搜索引擎搜索的数据,该系统设计了一个基于WebCollector的网络爬虫,通过该网络爬虫,抓取网络上的数据。WebCollector是不需要配置,并且便于二次开发的Java爬虫框架,用户可以在其基础上开发自己想要的爬虫。
该系统还设计了简洁美观的搜索界面,增强用户的搜索体验。
关键字:搜索引擎;音乐;Luence;网络爬虫

目录:
摘   要    I
Abstract    II
1.绪论    1
1.1课题背景    1
1.2研究现状    1
1.2.1国内搜索引擎现状    2
1.2.2国外搜索引擎现状    3
1.3本章小结    4
2.系统技术分析    5
2.1搜索引擎概述    5
2.1.1爬行和抓取    6
2.1.2建立索引    6
2.1.3搜索词处理    7
2.2B/S结构    7
2.3Servlet 的原理    8
2.4WebCollector    9
2.4.1WebCollector简介    9
2.4.2WebCollector架构图    10
2.5Lucene    11
2.5.1Lucene简介    11
2.5.2Lucene系统结构    13
2.6CSS    14
2.7本章小结    15
3.系统总体设计    16
3.1系统总体架构图    16
3.2系统分支模块架构图    16
3.2.1网络爬虫模块架构图    16
3.2.2索引模块架构图    17
3.2.3检索模块架构图    18
3.3本章小结    22
4.系统详细设计    23
4.1网络爬虫模块    23
4.1.1种子站点的选择方案    23
4.1.2网页信息的提取    23
4.1.3链接的过滤    23
4.2索引模块的设计    24
4.2.1索引建立    24
4.2.2分词    25
4.3检索模块的设计    25
4.3.1Lucene的查询接口    25
4.4用户界面设计    25
4.5本章小结    27
5.系统实现    29
5.1网络爬虫的实现    29
5.2索引建立的实现    31
5.3检索模块的实现    33
5.4本章小结    34
6.系统测试    35
6.1网络爬虫测试    35
6.2搜索引擎测试    35
6.3本章小结    39
结束语    40
参考文献    41
致 谢    42
附录A 外文原文    43
附录B中文翻译    55

论文字数:34663
包含资料:


截图:



百度网盘下载地址(金币充值):
**** 本内容需购买 ****
页: [1]
查看完整版本: 音乐搜索引擎的设计与实现