|
技术:Java、Hadoop等
摘要:
目前单机推荐系统己经不能计算海量数据和存储等需求,分布式的推荐系统现在已经成为今年来的热点。
基于Hadoop的电商的分布式大型推荐系统这一课题,我通过阅读大量的文献和研究,分析了国内外研究现状及面临问题。对电子商务推荐系统常见的推荐算法讨论,还有本文还对Hadoop平台的两大核心技术HDFS和MapReduce的工作流程和原理进行了介绍。对于电子商务传统推荐系统存在的很多问题,我论文基于Hadoop的电商推荐系统,系统有Hadoop的优点能具备良好的可扩展性伸缩性,可以方便快捷的对系统的计算能力和存储能力调大调小根据业务需求进行调整。对数据预处理、基于物品的协同过滤推荐算发还有混合推荐算法的相似性计算等算法设计,使之完美的运行在Hadoop平台上,实现分布式的推荐计算。
关键词:电子商务;推荐系统;协同过滤;Hadoop
目录:
摘要 IAbstract II
1绪论 1
1.1研究背景与意义 1
1.1.1信息过载与个性化服务 1
1.2现阶段关于推荐系统的现状 2
1.3论文的主要工作及结构安排 4
2.Hadoop简介 5
2.1 Hadoop简介 5
2.2 Hadoop生态简介 5
2.3详细介绍HDFS和MapReduce 6
2.3.1 HDFS 6
2.3.2 MapReduce 7
3.商品推荐系统的设计 8
4.具体的算法实现和效果 10
4.1数据切分 10
4.2 用户向量 11
4.3 共现矩阵 11
4.4 用户矩阵乘以共现矩阵 12
4.5 按商品ID做累加 13
4.6 除去用户已经购买过商品 13
4.7 验证 13
5.实验 15
5.1 数据集的介绍 15
5.2实验平台简介 15
附录A 17
附录B 20
附录C 23
附录D 27
附录E 30
附录F 36
参考文献 38
论文字数:9038
包含资料:
截图:
百度网盘下载地址(金币充值):
游客,本付费内容需要支付 200金币 才能浏览 支付
|
|