|
课程介绍:
7 P0 r5 ]; n; q7 d* ]. G, w% l% F0 f" R! i& [
本课程主要对Spark进行了简单介绍,给出了Spark的生态系统综述,同时进行Spark基本概念、计算模型进行了阐述,最后向大家讲解了Spark开发环境的配置。$ l. k, f9 n6 V' d
6 q8 V* M+ n) E4 e+ W课程背景:
p3 z1 D7 ^( D; m, X1 ?' P: v* M/ Q
Apache Spark是自由开源的分布式内存计算平台,目前已经成为 Apache 基金会的顶级项目。该平台可以快速、多计算范式、可靠地处理海量数据,除了基本批处理型外,还支持流计算、图计算、SQL分析和机器学习。
+ u/ R, B4 W& R& D1 C3 w k. u2 B6 W, ]( d. p( E) p3 C. N. X
核心内容:
1 V j: t/ e% a. e5 }; E6 _' ~
5 z- a& F- k; \0 f4 r- \1.Spark生态系统
1 c- B P( ]/ {( t1 B# F2 g" F! u5 {2.Spark优点
, b3 C! P4 H. d" N F8 ] z* ?& Q) D3.RDD
S( a8 p, ^. M$ S! y! N4.Transformation和Action6 g3 I x* a9 |9 P/ A8 t
5.Spark开发环境搭建
* o1 P5 w$ z* r( E5 N4 U
8 m) W; ~: Y9 O# ~! z. h+ }软件环境:Intellij,Linux,Scala ( S3 e. v+ L/ ]9 A* @; ~/ }& g+ J6 K
! _1 d2 t3 C! A* |是否提供资料:否 2 h2 J+ K' y) J/ X
. ?% C$ Q6 C# ^+ ?
课程等级:中级
4 l! L0 N- G! _% J5 F3 F' G: B& f3 z5 K, k! \
适合人群: 4 A# X9 M3 U9 @9 U
5 g/ Q/ s9 K+ m8 j; O数据工程师,数据分析师
& p" x/ E9 N: _! Y5 I; K
! A0 u/ M- E, Z6 t8 J2 W2 q8 J课程目录:
1 l* |& V0 R& Z" H$ H- t8 d- L' b3 }, T( J/ U0 | E; P! y/ k) J4 d
1 Spark简介 06:59; O6 h5 E+ w D. M
本课时介绍 Apache Spark的前世今生、基本功能。Spark生态系统,并对比传统批处理式系统讲解Spark的优点。
9 ` B! q5 C( R( X9 K* n+ j4 |3 _2 Spark计算模型 08:29
/ ~8 o0 e9 I5 L5 x本课时介绍Spark计算模型,讲解了RDD和RDD上的运算Transformation和Action,以及Spark的运行时模型。
* f. d c; v, r3 Spark开发环境搭建 13:01
+ a7 d5 K" K! k( b5 C: i本课时主要介绍Spark开发环境的搭建,在Windows以及Linux平台搭建Spark开发环境,通过SBT构建Spark项目,通过Spark Shell执行Spark程序。: J; k/ q4 _: k4 L
& y$ k7 Y9 P* E/ c/ L0 u4 X
# ^+ R% d" @. i+ h) ~+ w% h
5 b# n* E' i) Z* v/ c
7 G6 B+ w# |1 e3 r资源下载地址和密码(百度云盘): [/hide] 百度网盘信息回帖可见6 W- ^' b0 m( u
) Z& I. r$ ^ G9 R$ v
0 A' | S4 z% Y
% q' j- v2 k" k, x _9 b7 x
本资源由Java自学网收集整理【www.javazx.com】 |
|