|
课程介绍:
3 p T1 b4 Q4 W7 L/ i' W1 w# y3 ~) @% n
本课程主要对Spark进行了简单介绍,给出了Spark的生态系统综述,同时进行Spark基本概念、计算模型进行了阐述,最后向大家讲解了Spark开发环境的配置。1 n* N: M: i/ ] q D
( l" _$ k/ B( E6 Q! r4 w
课程背景: " x1 G6 {: D2 c
: ]% V6 J2 `) AApache Spark是自由开源的分布式内存计算平台,目前已经成为 Apache 基金会的顶级项目。该平台可以快速、多计算范式、可靠地处理海量数据,除了基本批处理型外,还支持流计算、图计算、SQL分析和机器学习。
2 n; F _8 o: ?5 G6 j5 ?6 p. Q8 A9 R1 I* Q
核心内容:
( p. i! e, y7 M3 L- ], m9 v! M6 D% v# {6 `4 a3 r- M
1.Spark生态系统' D( `' E% v; }; d, A+ D+ O/ b
2.Spark优点
4 w1 @5 c# i: s/ L' z* U2 \2 y$ S3.RDD
8 V' q6 W% a8 H- u4 n, ~4.Transformation和Action9 h( |- |5 W0 `% p, d( B( b
5.Spark开发环境搭建
: ]; D! H: [# Z! X# e/ X
5 L- I; Z% c4 l% F软件环境:Intellij,Linux,Scala # M( {) D8 K3 i- V. y
8 x) v/ w. b, U6 P! {1 _' i, H
是否提供资料:否 8 E% s' K2 t1 I. @" O) y6 p/ `; N
) T# v e5 s* Q) x P- [
课程等级:中级
# {7 H; Z4 ?6 S( f
5 i+ t; b: h1 Z4 A7 t+ @0 G9 p适合人群:
2 f. ?6 y' z) `: W0 P# b
- |# u3 S1 @& O- ]数据工程师,数据分析师 F4 k4 s' l# P4 ^' m: g
/ `, f9 V1 I1 H( t
课程目录:
. `0 ?4 O5 s7 H; g# f! U) d! c- M n( P7 Q; Z, V6 j
1 Spark简介 06:59
3 |: f3 M0 t: _( t本课时介绍 Apache Spark的前世今生、基本功能。Spark生态系统,并对比传统批处理式系统讲解Spark的优点。: k" Q, e2 x1 j: E/ N% z& Y
2 Spark计算模型 08:29
5 U- T; z1 c" m. E! e+ K本课时介绍Spark计算模型,讲解了RDD和RDD上的运算Transformation和Action,以及Spark的运行时模型。- U% C4 S! B' V3 g' k& b" q
3 Spark开发环境搭建 13:01
0 z, B' y, p( E+ A8 R本课时主要介绍Spark开发环境的搭建,在Windows以及Linux平台搭建Spark开发环境,通过SBT构建Spark项目,通过Spark Shell执行Spark程序。- c3 v' \; s( c/ ^. z
0 P y& ~ C) }' U( x3 R; Q' q& ]* t0 K
5 m U( B$ N" d/ _* q8 g* k
: x# J8 m1 j- @ ^% G
3 Z1 E. I/ y$ B) Y0 i) o) y
资源下载地址和密码(百度云盘): [/hide] 百度网盘信息回帖可见1 W) g. N1 I9 N8 v
0 m k6 `1 G* Y, s
$ o) f4 ]: a ?
. H" o. p+ { F( b
本资源由Java自学网收集整理【www.javazx.com】 |
|