1937| 1
|
深入大数据架构师之路视频教程 |
课程介绍:
大数据在这几年火得一塌糊涂了,甚至上升到了国家战略的高度,职场上30万-50万年薪的职位比比皆是。无数先知先觉的小伙伴已经华丽转身,实现了人生的小目标,你还在观望吗,还不赶紧上车,做一只随风飞舞的猪?还想着下趟车会有卧铺!!! 大数据真的很难吗?不见得,如果你想做个开发工程师的话,map reduce、spark 的编程范式对于有一定开发经验的程序员来说,上手是很快的。但根据讲师自己多年的经验来说,单纯做程序员很容易思维固化、眼界局限,重复的发明轮子。但是要想再往高一层的level晋升,比如架构师级别,那hdfs、yarn、hive、hbase、kafka、zookeeper、impala、presto、phoenix、kylin、CAP、ELK、Solr一大堆面目可憎的小怪兽就成了拦路虎。 大数据的难点在于它的生态系统太庞杂,家族血统太混乱,面对一个企业场景有n多的方案说“我行,我不是一般人”。就好比吃顿午餐,既可以端着碗吃,也可以就着锅吃,甚至倒到桌上手抓。每种吃法都能吃饱,但有的吃相很自然、很舒服,有的吃法很别扭,很猥琐。如何温文尔雅、如沐春风这就体现架构师的水平了。 本课程根据老师多年在国内一线互联网公司实际工作经验,整理提炼的一套侧重培养大数据架构师级别的实战课程,讲重点介绍大数据在一线企业中的使用方案,对于各个组件,除了详细介绍必须掌握的操作要领,更重点介绍不同业务场景下的设计和应用技巧。绝不同于市面上大多数的操作手册朗读者。 本课程设计包括如下几个层面: 1.大数据集成:主要介绍目前很火的ELK框架中的filebeat和logstash,相比较flume更轻量、更容易上手。 2.大数据传输:主要介绍kafka的原理和使用技巧 3.大数据落地:主要介绍hive和hbase这两款标准组合的原理和使用,并结合具体的业务场景揭秘高级设计和应用。 4.大数据使用:主要介绍企业中最有用的sql on hive、sql on hbase的解决方案,如何让hive速度提升十倍,如何让hbase像个rdbms,如何在hive中实现scd2等实际问题。 5.大数据搜索引擎:主要介绍目前很火的ELK框架中Elasticsearch,并详细演示从常规操作到高阶查询的全实战内容。 相信通过本课程的学习,勤奋的您已经深入到大数据的架构师层面,剩下来的就是在工作中不断的填坑不断的打怪升级,最终圆满。 课程大纲. 第1节课程体系介绍 00:27:03分钟 第2节hadoop精讲之map reduce原理及代码演示 00:30:25分钟 第3节hadoop精讲之hdfs详解(1) 00:21:35分钟 第4节hadoop精讲之hdfs(2) 00:25:35分钟 第5节hadoop产品选型 00:15:58分钟 第6节实战.基于hadoop streaming的wordcount 00:23:47分钟 第7节实战.topn的实现原理和实战 00:17:31分钟 第8节实战.join的实现原理和实战 00:17:53分钟 第9节实战.对join实现的改进——优化reducer 00:12:45分钟 第10节hive概述 00:26:20分钟: 第11节hive必须要会的操作演示 00:29:56分钟 第12节分区表和动态分区的使用 00:25:13分钟 第13节函数概述和udf演示 00:20:00分钟: 第14节UDF实战:实现udf 00:15:56分钟 第15节UDAF实战:实现udaf 00:24:34分钟 第16节数据说明和重要操作演示 00:24:03分钟 第17节用户内容偏好实战 00:17:03分钟 第18节什么是SCD以及技术难点 00:20:25分钟 第19节如何在hive中实现sequence功能 00:13:49分钟 第20节数据仓库实战:在hive中实现 scd2的完整案例实战 00:21:18分钟 第21节数据仓库实战:在hive中实现事实表 00:24:33分钟 第22节presto是什么.presto的架构 00:27:52分钟 第23节presto运行机制和配置文件详解 00:19:58分钟 第24节presto on hive 实战.实现数据仓库的Scd2和fact 00:23:00分钟 第25节kafka架构深度剖析_1 00:15:20分钟 第26节kafka架构深度剖析_2 00:15:22分钟 第27节架构师装逼必备--CAP理论以及在架构设计中的应用 00:32:29分钟 第28节kafka数据复制高可用的原理 00:21:00分钟 第29节kafka数据复制演示 00:12:58分钟 第30节选学--深入解释leader和follower数据同步机制 00:16:56分钟 第31节kafka数据一致性参数详解 00:16:40分钟, 第32节数据一致性的实战 00:10:22分钟 第33节配置zookeeper集群并验证 00:09:58分钟 第34节配置kafka集群并验证两个集群正常工作 00:09:02分钟 第35节修改kafka在zookeeper上的配置目录以及consumer的使用方式 00:06:18分钟 第36节kafka consumer 剖析 00:30:24分钟 第37节kafka consumer代码实战 00:17:13分钟 第38节kafka consumer balance 实战 00:18:48分钟 第39节实现轮询的producer 00:09:27分钟 第40节hbase概述和web界面 00:19:36分钟 第41节hbase架构详解.1 00:22:06分钟 第42节客户端数据读写流程以及zookeeper的作用 00:12:46分钟 第43节hbase架构详解.2 00:22:54分钟 第44节hbase高可用能力 00:15:30分钟 第45节hbase data model详解 00:20:42分钟 第46节数据操作实战.hbase工具功能 00:30:33分钟 第47节column family的进阶设置实战 00:21:01分钟 第48节二级索引技术解密 00:31:59分钟 第49节电商应用的二级索引设计实战 00:15:49分钟 第50节项目背景概述 00:20:07分钟 第51节第一版设计及问题分析 00:10:51分钟 第52节第二版设计及问题分析 00:04:40分钟2 第53节第三版设计及问题分析 00:07:12分钟 第54节最终设计方案ddi 00:07:49分钟 第55节hive on hbase概述 00:18:36分钟 第56节hive on hbase实战.把产品成本表加载到hbase 00:14:27分钟 第57节phoenix及对比hive on hbase 00:15:40分钟 第58节phoenix实战.1.通过view映射hbase中的用户表并分析其特点 00:20:23分钟 第59节phoenix实战.2.通过table映射hbase中的用户表并分析其特点 00:05:30分钟 第60节phoenix实战.3.通过table映射hbase中的用户表并体会其特点 00:08:26分钟 第61节项目实战 00:13:58分钟 第62节hbase事务机制概述 00:16:38分钟 第63节hbase事务之mvcc详解以及和sql数据库的对比 00:22:09分钟 第64节hbase物理存储原理解析 00:22:34分钟 第65节和hbase存储机制有关的一个大坑 00:13:46分钟 第66节禁用掉自动split后如何维护 00:24:15分钟 第67节python_hbase开发实战 00:23:01分钟 第68节python_phoenix开发实战 00:14:50分钟 第69节项目实战.python_hbase_phoenix_用户行为分析 00:29:37分钟 第70节kylin概述和工作原理 00:24:26分钟 第71节数据仓库核心概念 00:30:54分钟 第72节cub的设计和构建过程 00:35:06分钟 第73节实时cube的设计和构建 00:19:18分钟 第74节案例实战 00:34:40分钟 第75节和传统bi工具的结合 00:06:34分钟 第76节运维管理 00:24:37分钟 第77节elk技术栈介绍 00:24:11分钟 第78节安装配置zookeeper 00:03:46分钟 第79节安装配置kafka 00:05:34分钟 第80节验证kafka安装成功 00:05:47分钟 第81节安装配置filebeat 00:10:55分钟 第82节验证filebeat配置成功 00:04:53分钟! 第83节配置logstash 00:03:05分钟 第84节安装配置elasticsearch 00:03:13分钟1 第85节安装配置kibina 00:05:25分钟- 第86节安装ik索引做中文分词 00:20:03分钟 第87节几个辅助工具的安装演示 00:21:34分钟 第88节通过restapi操作Elasticsearch的演示 00:20:39分钟8 第89节elasticsearch基本概念(index,type,setting,mapping) 00:25:27分钟 第90节深入解析mapping.字段类型 00:28:50分钟- 第91节深入解析analyzer 00:21:00分钟 第92节索引机制详解 00:31:18分钟 第93节几个高级参数介绍--all、source、store、doc_values 00:30:17分钟 第94节动态映射 00:10:51分钟 第95节字段的动态mapping 00:15:50分钟4 F& |. m" W& ?; _ 第96节字段的动态mapping之dynamic_template 00:06:47分钟 第97节index template详解 00:07:17分钟 第98节索引模版和索引别名 00:18:48分钟 第99节最简单的logstash演示 00:10:20分钟 第100节实战2.多个输出目标 00:05:44分钟 第101节实战3.解析日志内容 00:11:13分钟! 第102节实战4.解析json格式日志 00:05:12分钟 第103节实战5.如何把@timestamp修复成本地时间 00:10:28分钟 第104节实战6.把logstash收集的数据保存到hdfs 00:10:25分钟 第105节实战7.如何用access_time替代@timestamp 00:07:45分钟 第106节实战8.利用插件获取更多的信息 00:06:07分钟 第107节查询语法总结 00:16:18分钟 第108节match搜索 00:13:03分钟 第109节range搜索 00:05:35分钟 第110节term搜索 00:08:16分钟 第111节terms进阶用法-关联查询 00:10:17分钟 第112节exists和not exists 00:04:55分钟 第113节bool查询 00:08:29分钟 第114节filter查询 00:10:57分钟 第115节聚合功能概述以及度量函数说明 00:09:51分钟 第116节聚合功能概述值度量函数的使用演示 00:15:20分钟 第117节聚合功能概述之分组聚合函数说明 00:09:32分钟 第118节聚合功能之分组函数实战之terms实战 00:14:23分钟 第119节聚合功能之分组函数实战之histgram和range 00:10:45分钟 第120节聚合同能之分组函数实战之data_histgram 00:04:49分钟 第121节聚合功能之分组函数实战之filter and filters 00:06:45分钟 第122节terms分组统计 vs query中的term terms 00:18:04分钟 第123节向桶中添加统计指标 00:05:40分钟 第124节桶中桶和联机OLAP 00:12:10分钟 百度网盘下载地址:
购买主题
本主题需向作者支付 50 金币 才能浏览
| |
| ||