|
Java视频教程名称:价值366元 大数据 Spark SQL日志分析视频教程 spark视频教程
7 C7 l! f4 x- W2 q* R百度网盘下载链接: \! T# f2 e& @5 o, T( c
[/hide]) e/ F. k3 k* c+ N0 w* C2 g
密码: 78fe 【解压密码:javazx.com】$ L8 c( f* S H
集数合计:11章
. ~" M# }5 |/ z- V
. o; X! [( B# l8 ], i
$ x" V- m% Q9 T
) S; c7 a$ k% Y2 Q
0 A- E8 e1 k( k0 \
链接失效声明:如果本链接地址失效,请及时联系站长QQ:40069106
( T8 `! z( ~( H( T. u如何获取资源:VIP升级: https://www.javazx.com/tpgao_wmcard-wmcard.html+ a; p+ d( H2 a3 i; c" m
VIP说明: 月度VIP:使用期限30天
9 R) a9 z" E) p# N 年度VIP:使用期限365天! d6 u( z' q k9 n
终身VIP:使用期限永久
+ ]# {( f0 a0 [$ }5 k! T1 _) h/ I. S/ M( @1 T s, J& s4 p9 e
Java视频教程详情描述: 8 g5 |+ ~) u$ f) w
A0247《价值366元 大数据 Spark SQL日志分析视频教程》本课程以“慕课网日志分析”这一大数据应用案例为主线,使用慕课网真实日志,以目前主流的、最新的Spark稳定版2.1.x为基础,依次介绍相关的大数据技术:Hadoop、Hive、Spark SQL,涉及数据清洗、统计存储、处理入库以及数据可视化(Echarts、Zeppelin),最终会形成一个完整的大数据项目。java视频教程配套
- a5 y9 N/ u9 m* B, l' n) R0 M. y5 D3 J, s# `% K, h
Java视频教程目录:
) o+ v" p( Z" T9 a* }& T
8 ?) ?, L( V4 n+ p- Y. b1 I
% \* s' L W0 ]% i0 l, l第2章 Spark及其生态圈概述% P$ X8 L# r4 V- E! ~
Spark作为近几年最火爆的大数据处理技术,是成为大数据工程师必备的技能之一。本章将从如下几个方面对Spark进行一个宏观上的介绍:Spark产生背景、特点、发展史、Databricks官方调查结果、Spark与Hadoop的对比、Spark开发语言及运行模式介绍 ...# C6 J' k' O& \0 i* l
# E% R1 @) E5 V) c
2-1 -课程目录0 A) N0 w3 I2 X7 E0 K4 J. x4 v
2-2 -Spark概述及特点6 E% U0 w( i/ N/ _, w4 c* ?* V
2-3 -Spark产生背景
& t3 Z) S M& C# R- M7 \$ ?& ]# ?) n2-4 -Spark发展历史
( w8 t1 C1 r8 Y4 y: _8 U5 }2-5 -Spark Survey
! I* ]: o: F! e" c: T& G2-6 -Spark对比Hadoop
1 I8 V, F7 o: k) U2 _2-7 -Spark和Hadoop的协作性
- T5 i% ?) r! o$ a' Z1 l6 ]第3章 实战环境搭建
7 h7 [, i" V) h" G) S工欲善其事必先利其器,本章讲述Spark源码编译、Spark Local模式运行、Spark Standalone模式运行. y1 \8 O& L2 h# q* K% V; V
【Java自学网 www.javazx.com】
/ o6 Q9 r! r* ~3-1 -课程目录
# {( U, @- ]& D# v3 T: q3-2 -Spark源码编译7 d- a$ Q! ]- r4 _
3-3 补录:Spark源码编译中的坑
- r8 P1 P" Q2 P8 m. m3-4 Spark Local模式环境搭建" z9 R, E/ Z7 u, r" h
3-5 Spark Standalone模式环境搭建5 \* y7 N- d- H0 D
3-6 Spark简单使用) L3 \( k) |$ F$ ~3 ?2 l
第4章 Spark SQL概述 \. N) I/ |4 H8 m, d
Spark SQL面世已来,它不仅接过了Shark的接力棒,继续为Spark用户提供高性能SQL on Hadoop解决方案,还为Spark带来了通用、高效、多元一体的结构化数据处理能力。本章将从Spark SQL前世今生、SQL on Hadoop框架、Spark SQL概述、愿景、架构,这几个角度进行展开讲解...
2 r4 w6 t9 @8 g) C9 L5 \2 v" X$ S: j4 P3 _2 A4 b- A
4-1 课程目录6 Q" r' t( m9 r6 S; M
4-2 -Spark SQL前世今生9 A/ m+ c2 v* W8 [1 K* q
4-3 -SQL on Hadoop常用框架介绍9 X# ?$ S: h. H+ w/ p4 u/ Z. U3 v
4-4 -Spark SQL概述
% {2 g( e8 T6 _* }) S$ U' _5 @4 z4-5 -Spark SQL愿景
8 |9 A* T/ D: d' q y4-6 -Spark SQL架构
+ q% c3 M) q! S/ ~$ b9 [第5章 从Hive平滑过渡到Spark SQL
% V. A2 Y5 N8 |' H6 m# {3 y, m$ s4 ^Hive是SQL-on-Hadoop的解决方案和默认的标准,如何将数据处理从Hive过渡到Spark SQL上来是我们必须要掌握的。本章我们将讲解在Spark中操作Hive中的数据几种方式( ]0 p, X$ v1 N5 ?4 {
6 g* j I$ k! v( ~5-1 -课程目录' ?" C8 J9 Z; c2 l7 l J- |
5-2 -A SQLContext的使用
! l0 E& X4 R1 f0 U, W; c7 h) ^' h5-3 -B HiveContext的使用; A) L/ \$ U# R% a* H# y( p; W
5-4 -C SparkSession的使用) L5 o: ?# G% i, L
5-5 spark-shell&spark-sql的使用6 i% T0 m. W X/ z6 m
5-6 -thriftserver&beeline的使用7 V( h- x- i! U7 Z. v. y
5-7 -jdbc方式编程访问
) C# x2 s- n. R' Z第6章 DateFrame&Dataset% w' s4 Y& E$ _: _
DataFrame&Dataset是Spark2.x中最核心的编程对象,Spark2.x中的子框架能够使用DataFrame或Dataset来进行数据的交互操作。本章将从DataFrame的产生背景、DataFrame对比RDD、DataFrame API操作等方面对DataFrame做详细的编程开发讲解% \9 h- j+ o7 w
$ e6 y, l7 b* K- U& {6 y4 Z
6-1 -课程目录
# q) w3 Z# O, R. a4 _% N% p% w6-2 -DataFrame产生背景" W. x I; J$ U* M
6-3 -DataFrame概述
a% _% `& n2 U; n" q: F0 e6-4 -DataFrame和RDD的对比
1 {& K7 @6 Y7 { }; R4 n6-5 -DataFrame基本API操作% f' d9 y' v. c0 U/ A: C9 w" W
6-6 -DataFrame与RDD互操作方式一
$ `0 M. a4 e) u9 k6-7 -DataFrame与RDD互操作方式二
( L0 m7 g6 f; c) [6-8 -DataFrame API操作案例实战6 d7 Q7 }$ F) v# e% H1 }
6-9 -Dataset概述及使用2 s' `9 H3 d% h
第7章 External Data Source
k$ H/ o1 D0 g' cSpark SQL中的核心功能,可以使用外部数据源非常方便的对存储在不同系统上的不同格式的数据进行操作。本章将讲解如何使用外部数据源来操作Hive、Parquet、MySQL中的数据以及综合使用3 D3 B: Y% ^, `* @$ K8 {
m" v$ ?. a& d# I4 |& I0 E3 j
7-1 -课程目录
, Y% I- D$ x2 J! F1 f0 v R7-2 -产生背景# E. ]" r: ^- f0 }3 ] g
7-3 -概述
6 b2 f- j" O5 P+ [3 Y4 S3 Y2 [7-4 -目标. A2 ~- ]% }7 t# a/ ^
7-5 -操作Parquet文件数据
# \4 p5 J1 A2 k) j1 f* v q! b* I7-6 -操作Hive表数据; T1 e) _5 p1 V) e
7-7 -操作MySQL表数据
4 d y+ n" M$ ]2 q, v7-8 -Hive和MySQL综合使用9 ]! N' s/ s W- O( j# l! x
第8章 SparkSQL愿景6 o% u- j% ~% u
本章将讲解Spark的愿景:写更少的代码、读更少的数据、让优化器自动优化程序) Z _& W% L7 U+ B+ ?( R, C
4 [4 U, a% b$ v# G6 F# X. u8-1 -A SparkSQL愿景之一写更少的代码(代码量和可读性)3 E! Z1 ^; [6 x3 ^6 ~4 B0 v4 n
8-2 -B SparkSQL愿景之一写更少的代码(统一访问操作接口)) I$ ]/ l$ q' |) E1 T, @8 k( E
8-3 -C SparkSQL愿景之一写更少的代码(强有力的API支持)* u" z$ _' m% \
8-4 -D SparkSQL愿景之一些更少的代码(Schema推导) ?* e* L) _: x& r5 ^* R G. D
8-5 -E SparkSQL愿景之一写更少的代码(Schema Merge)! {' B+ B& D/ |1 E7 A" |
8-6 -F SparkSQL愿景之一写更少的代码(Partition Discovery)
0 S- U% K ~: A1 s8-7 -G SparkSQL愿景之一写更少的代码(执行速度更快)
4 w3 o2 N$ M8 N0 x! n) Z9 S8-8 -SparkSQL愿景之二读取更少的数据
) r7 e# R7 \) S3 j( f& Y8-9 -SparkSQL愿景之三让查询优化器帮助我们优化执行效率
# W3 \# N; p2 g9 u% l9 R8-10 -SparkSQL愿景总结
* Y- {% Z6 D) P @2 C- A6 ^0 c第9章 慕课网日志实战
+ z6 J# A E* n7 k本章使用Spark SQL对慕课网主站的访问日志进行各个维度的统计分析操作,涉及到的过程有:数据清洗、数据统计、统计结果入库、数据的可视化、调优及Spark on YARN。通过本实战项目将Spark SQL中的知识点融会贯通,达到举一反三的效果 ...( u" @; e: u- @0 U, s0 A
. H3 m* d9 k! k* d7 _' w' g4 l
9-1 -课程目录- G( N* G! s' Q+ s) k4 \
9-2 -用户行为日志概述+ k/ k4 i7 M0 M* ~& I
9-3 -离线数据处理架构1 x }/ E( n6 z+ U
9-4 -项目需求7 n6 O1 @3 i( T7 W4 ]
9-5 imooc网主站日志内容构成7 }+ k1 Z' m) G8 X7 |: A) n, q
9-6 数据清洗之第一步原始日志解析
$ f1 R& W1 p v5 v$ B4 T$ B9-7 -数据清洗之二次清洗概述
" ]3 [; c4 ~: N& q, P2 S! e9-8 -数据清洗之日志解析
h3 h+ y% G. Y9-9 -数据清洗之ip地址解析
3 C0 v+ B( @' T5 S, e6 u/ E3 @( j9-10 -数据清洗存储到目标地址; I; d2 N4 a7 k& m
9-11 -需求一统计功能实现
' r! W/ F: b* T% q3 l7 P& y/ [9-12 -Scala操作MySQL工具类开发& k s8 b( @3 }$ ^$ o( }9 {8 u
9-13 -需求一统计结果写入到MySQL; G/ b2 ?$ k2 `( F# n$ ^
9-14 -需求二统计功能实现
1 C6 l7 ? w8 c2 f2 ^5 r9-15 -需求二统计结果写入到MySQL
4 F7 S$ f4 B! F( s. z# [. n/ \& o! R: s% j! n9-16 -需求三统计功能实现
% u, e& e3 G s+ |8 z) [5 c: \9-17 -需求三统计结果写入到MySQL
3 F( i, G6 r5 d% z9-18 -代码重构之删除指定日期已有的数据$ z% R/ V3 P) ]2 k
9-19 -功能实现之数据可视化展示概述" }/ j V+ j' w! u
9-20 -ECharts饼图静态数据展示
n _$ ~5 z) o8 U% o5 I; o- {0 G9-21 -ECharts饼图动态展示之一查询MySQL中的数据& I5 ?2 x( U0 W- D. v$ o
9-22 -ECharts饼图动态展示之二前端开发
* O5 o2 ?' ?8 y: {+ H T9-23 -使用Zeppelin进行统计结果的展示
" c! T8 [- } C+ z0 C. }9-24 -Spark on YARN基础* Q* I: f! z* A5 {+ ~# E1 l! [
9-25 -数据清洗作业运行到YARN上0 J( K6 g5 \. G) V6 B `7 ]
9-26 -统计作业运行在YARN上
* b3 ^/ c: F( ~1 d' l" |9-27 -性能优化之存储格式的选择& w( A( k" z( E
9-28 -性能调优之压缩格式的选择
* a% x. e9 V- X3 v9-29 -性能优化之代码优化
9 Z0 Y2 E+ H5 W/ v' u* `/ q9-30 -性能调优之参数优化& \+ T E u! P) p
第10章 Spark SQL扩展和总结4 a8 U8 c. X# ?# g1 S
本章将列举Spark SQL在工作中经常用到的方方方面的总结
! `7 f5 F. Q6 A D+ ~
+ P# l$ [$ v- D10-1 -课程目录; R* O( v. ~3 {/ {* C' W6 Y
10-2 -Spark SQL使用场景
$ p# q/ ~" u6 m10-3 -Spark SQL加载数据
+ I' I! O% H& K0 S! j5 P& P10-4 -DataFrame与SQL的对比# o4 ?. S+ b' u/ z; j
10-5 -Schema7 t* K. v3 k6 R7 ~# _. G) t4 A
10-6 -SaveMode3 Q+ n0 `& G8 T2 q/ F5 w8 p5 U
10-7 -处理复杂的JSON数据
/ ]+ [% c2 y, r4 V10-8 -SQL的覆盖程度1 |2 a9 e$ O6 d! A: D/ f" }9 n: K
10-9 -外部数据源3 S' W* z! C- M1 e1 S
第11章 补充内容
7 P+ a5 t' n0 R9 z2 CSpark SQL自定义外部数据源使用实战" g Y$ Q9 |2 t% y
- `& p5 E9 y5 G- g* l o0 L
11-1 -课程安排
+ F5 N7 a& h* _* t" o11-2 -外部数据源接口
5 h2 |5 ]* P" J$ f# J& T6 x11-3 -JDBC外部数据源实现源码分析
" X o6 k/ t& W2 t& f11-4 -文本数据自定义外部数据源实现案例分享1 v: G+ P2 v6 I" L" x, h. Z4 H8 A
$ o9 v P6 f* S3 H( g1 n+ l
1 Y1 | c0 H, L. ^# L5 t
, v- C! M y# j
% P% {) D8 ^/ [2 c5 J
+ e# w, M# f Q. ] |
|