java自学网VIP

Java自学网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 9369|回复: 48

《Flink大数据分析实战》带书签PDF

[复制链接]

该用户从未签到

8

主题

144

帖子

270

积分

普通会员

Rank: 2

积分
270
发表于 2024-8-7 12:29:53 | 显示全部楼层 |阅读模式
简介( w9 c3 b8 W+ f' e) s2 O& ^7 P1 ?
书名:Flink大数据分析实战[size=10.2047pt]作者:张伟洋
5 o7 V# `- d7 {. g, r+ _[size=10.2047pt]出版社:清华大学出版社
9 n/ I: K$ l' b% \' D[size=10.2047pt]出版日期:2022-02-01
. J0 F9 o+ _5 Z8 ~: A3 E9 [" WISBN:9787302598183
: i# r& w. l0 U' L* M5 J' b
8 ~1 C5 D: q4 f' }/ F: [6 s& J目录9 @% W8 _+ c$ D* f) T5 G
    ' ^) l& q$ Q0 B4 u2 r  P- Q! U0 ~
  • 封面) {; L, t7 R6 S& }1 n
  • 版权信息
    $ l6 t! ?4 U( r& ?
  • 作者简介" G' ?: I/ b' ^2 e  o; U
  • 内容简介
    ' T6 e; o" v' Z6 h
  • 前言7 ~' t0 Q4 D% {5 G
  • 第1章 初识Flink
    : I$ g) S1 t& o2 ~
  • 1.1 大数据开发总体架构
    1 q0 I) @+ D. {. t7 P1 W4 H& j
  • 1.2 什么是Flink* r3 a9 t0 K; [3 @. c: u' [
  • 1.3 Flink的应用场景
    0 }- ~, `( _  P0 V
  • 1.4 流计算框架对比6 J# X0 H: Y8 J6 U
  • 1.5 Flink的主要组件
    2 d* l# l9 s, g8 \) ^7 ?
  • 1.6 Flink编程模型
    : l- v$ H8 k( F
  • 1.6.1 数据集
    8 f; k- `. D: Y% B: W" U; k
  • 1.6.2 编程接口
    ( K$ Y8 l2 h  {. e
  • 1.6.3 程序结构6 T8 j3 r: ~0 T5 V& E, S
  • 1.7 快速体验Flink程序9 I5 K) p' C3 G' F, {4 u
  • 1.7.1 IntelliJ IDEA安装Scala插件4 |; k) F, D# B9 l# T" |% y
  • 1.7.2 IntelliJ IDEA创建Flink项目
    % M! b$ c- B) P# g- i* c0 C1 ]
  • 1.7.3 示例:批处理单词计数5 j* H+ p- {: f( x0 I1 t7 j
  • 1.7.4 示例:流处理单词计数
    : B0 N# J# z2 u4 e" m: J* D8 L
  • 第2章 Flink运行架构及原理
    0 D! E, \) P; X; s% B) E
  • 2.1 Flink运行时架构/ x- e  r8 x) }) b& ]5 S' G3 |
  • 2.1.1 YARN集群架构
    0 h( f# Y% c3 {# k
  • 2.1.2 Flink Standalone架构
    7 @# Z9 [! J" ]8 o* c
  • 2.1.3 Flink On YARN的架构
    0 Z0 ~8 x  Q% f) D8 y$ d
  • 2.2 Flink任务调度原理
    & F$ _1 @# Q" |8 T5 I
  • 2.2.1 任务链& V* I$ O4 L2 Q3 Z0 K1 T; L
  • 2.2.2 并行度2 E; U0 a) D3 [$ b/ Y# b
  • 2.2.3 共享Task Slot
    * `, ]9 n+ \2 R
  • 2.2.4 数据流
    ( }% E4 t/ w  K' p
  • 2.2.5 执行图) D8 T0 }3 H5 K9 e
  • 2.2.6 执行计划
    5 b! }) n/ F# I( F0 i2 _' I5 m
  • 2.3 Flink数据分区/ G5 h3 p" ?( K. k* `2 K
  • 2.3.1 分区数量( e* x; b& v8 y8 ]5 v+ R- _9 U. |4 z- x
  • 2.3.2 分区策略
    * p+ R) I* r* v' s: Z
  • 第3章 Flink安装及部署
    * h- }7 j4 R$ d) K. T) g* u
  • 3.1 Flink集群搭建
    0 u" f! z+ S0 k) R. @
  • 3.1.1 Flink本地模式搭建
    3 f5 l7 ~) H6 f+ q7 Z
  • 3.1.2 Flink Standalone搭建; D+ b% L( {2 E6 O3 e; F
  • 3.1.3 Flink On YARN搭建9 s5 x# i/ ]( o9 {6 g% p& u' L
  • 3.2 Flink HA模式1 e) D7 [6 O, j$ Q; O4 K5 y) S
  • 3.2.1 Flink Standalone模式的HA架构1 m9 \# k% J; J+ J, G, ?
  • 3.2.2 Flink Standalone模式HA集群搭建, `8 m3 L% N4 M7 u* D" D; c* V2 D
  • 3.2.3 Flink On YARN模式HA集群搭建% l( ]( X( R: f* b/ @: G
  • 3.3 Flink命令行界面
    4 q( o. v4 ^( P9 T: Y$ L
  • 3.4 Flink应用提交
    # D; }9 v8 E, D0 u: I# b4 u8 T
  • 3.5 Flink Shell的使用( |2 s' p: B' N$ q6 o; g
  • 第4章 Flink DataStream API( ~, Z2 |4 }  Y6 b! |
  • 4.1 基本概念
    ' p! Y% L0 M5 S; l6 u5 |3 w
  • 4.2 执行模式
    % A9 q/ v% B: y$ W: q! a
  • 4.3 作业流程! e' ~4 k3 R4 |
  • 4.4 程序结构
    5 {* W  w/ n- `
  • 4.5 Source数据源$ c' I% G6 h5 e$ e3 D8 W
  • 4.5.1 基本数据源
    8 K. I0 }) O; @& z
  • 4.5.2 高级数据源. O1 }0 S% v+ \
  • 4.5.3 自定义数据源
    9 b* U/ x% f" i# z& W5 m
  • 4.6 Transformation数据转换
    5 O6 F( `' c! k; |9 g$ e* [$ |
  • 4.7 Sink数据输出
    1 x- w. n( O, X7 R
  • 4.8 数据类型与序列化
    . L$ O/ j2 s$ K. s$ u# F
  • 4.9 分区策略
    - S4 E1 E# X8 h/ t2 K2 J
  • 4.9.1 内置分区策略* M8 S* l/ }- {6 Q3 u4 h* \- ^
  • 4.9.2 自定义分区策略
    3 |/ U5 v5 m( p9 e: W
  • 4.10 窗口计算
    5 Y. h$ R( B4 W/ b* X
  • 4.10.1 事件时间) i: {2 L# K0 ?$ v
  • 4.10.2 窗口分类; O; n. X) X0 Z; j
  • 4.10.3 窗口函数, H9 }& C$ ^3 j: {, ?
  • 4.10.4 触发器) ~% F* p1 m4 s
  • 4.10.5 清除器
    0 C' o4 I. i1 S. [0 c- Y
  • 4.11 水印
    $ Z- y7 w3 K1 y/ N
  • 4.11.1 计算规则
    0 {5 L/ n9 N' {, j2 D
  • 4.11.2 允许延迟与侧道输出; b- U" u; J3 L: o  J; R
  • 4.11.3 生成策略
    / E& g0 F$ [8 Y6 {, V
  • 4.12 状态管理: z  ~" g/ F! g2 u! J
  • 4.12.1 Keyed State
    ( `/ w% K4 ?+ V  S2 i9 D
  • 4.12.2 Operator State, {, c+ {# ~" o3 h3 t+ e; }, N1 _- c
  • 4.13 容错机制" [0 G& d- E8 ?' q
  • 4.13.1 Checkpoint% }0 W3 f- a% E- r
  • 4.13.2 Barrier* x: `: _4 Q( P1 w& T
  • 4.13.3 重启与故障恢复策略
    # |- N* X  t0 k
  • 4.13.4 Savepoint" e: a* a* B( z$ D) v9 N
  • 4.14 案例分析:计算5秒内输入的单词数量
    * v# i/ y. k7 l7 P
  • 4.15 案例分析:统计5分钟内每个用户产生的日志数量- S0 V1 n$ I$ k5 B. N& Z2 S. H# V
  • 4.16 案例分析:统计24小时内每个用户的订单平均消费额- ?4 q  W! o  x6 @  j+ g1 I! v5 X
  • 4.17 案例分析:计算5秒内每个信号灯通过的汽车数量& a, J+ E( k9 }6 z
  • 4.18 案例分析:Flink整合Kafka计算实时单词数量
    . e# y, q% h/ J% U, R! R
  • 4.19 案例分析:天猫双十一实时交易额统计, y4 g* D' h& s6 r1 A
  • 4.19.1 创建自定义数据源
    2 R  i" M# G. t7 N* h
  • 4.19.2 计算各个分类的订单总额2 ^1 x$ p, {  D& I. v, S
  • 4.19.3 计算全网销售总额与分类Top3$ E) B- Y7 P1 F8 o5 H& @% ^3 ]: I
  • 第5章 Flink Table API&SQL
    & j5 U; t- D0 n/ f- d) k
  • 5.1 基本概念& I* z' m' P# q; l2 V2 _
  • 5.1.1 计划器* Q' f# w) F  S2 n% b1 U4 K6 y
  • 5.1.2 API架构
    ' ~5 g6 |( g8 p
  • 5.1.3 程序结构
    ! R3 o9 f$ \$ \7 y! G0 P
  • 5.2 动态表
    . r. E0 i8 b  Q" M3 U: Y1 B
  • 5.2.1 流映射为动态表
    ! i( _5 o; w$ V
  • 5.2.2 连续查询
    6 P. W  U; L( z5 U, j. {
  • 5.2.3 动态表转换为流
    : F9 |3 K9 L) n) f, F; l
  • 5.3 TableEnvironment API1 J6 Y* r8 R' s. z5 Y# N
  • 5.3.1 基本概念
    : v+ U! f+ N! Z& C& Y
  • 5.3.2 创建TableEnvironment
    9 V" D& |3 T4 z' Y, }' x
  • 5.3.3 示例:简单订单统计2 M( w3 W' k: B9 w8 m
  • 5.4 Table API
    5 d( N# Q5 j4 R; O& |
  • 5.4.1 基本概念
    : K9 y- `8 K3 A
  • 5.4.2 示例:订单分组计数/ _8 ]- p! N1 b' h
  • 5.4.3 示例:每小时订单分组求平均值
    3 ~/ \% ]* s) t0 @/ Q. c6 _
  • 5.4.4 关系操作% ^5 ?- C( ^3 V" W
  • 5.5 SQL API9 F' k2 J' s" {1 v
  • 5.5.1 DDL操作( C" o! S$ W9 {' B
  • 5.5.2 DML操作
    ; U1 J% f) s$ L# G; _
  • 5.5.3 DQL操作/ A& |9 i6 o& E5 s% [0 {$ P  ^
  • 5.5.4 窗口函数
    ' v6 g- t, b* M
  • 5.5.5 窗口聚合
    5 t5 Q9 @$ b8 |8 d! Q$ M. C: L( L  M
  • 5.5.6 分组聚合
    4 C& U! t( t! O5 o* u1 X" y
  • 5.5.7 OVER聚合
    8 L) q$ N. L. L( x
  • 5.5.8 连接查询
    # y0 O! n' R; q% N) ?- U
  • 5.6 TopN查询! |. H# }, w; x' m1 p" {
  • 5.6.1 OVER子句5 t$ n8 z! t4 j* o1 i
  • 5.6.2 示例:计算产品类别销售额TopN
    8 s. Q0 i1 }& v9 t6 c
  • 5.6.3 示例:搜索词热度统计+ Q4 R. S( B5 S/ B& }
  • 5.6.4 窗口TopN
    " b% L8 x' _" Q$ E- c
  • 5.7 Catalog元数据管理
      H; u* r1 J6 e: D+ [
  • 5.8 Flink SQL整合Kafka6 S9 h! o; A! S8 w; a7 y  ~' E
  • 5.8.1 基本概念
    * w$ |) `5 K2 h7 x  ?; U
  • 5.8.2 示例:Flink SQL整合Kafka实现实时ETL$ j' c8 y% a0 F/ h
  • 5.9 Flink SQL CLI
    & A) ~+ P0 i4 P5 q$ A' B2 S/ y; u
  • 5.9.1 启动SQL CLI
    4 {& y# X0 i$ r7 c
  • 5.9.2 执行SQL查询. M) V. x# Z" \
  • 5.9.3 可视化结果模式# l1 U; X1 z# N
  • 5.10 Flink SQL整合Hive3 m: }" ?; e0 F/ j$ R9 N( d
  • 5.10.1 整合步骤! D( B+ e9 Z' f* p, {8 T
  • 5.10.2 Table API操作Hive: r( {$ R- o  y  X% \
  • 5.10.3 示例:Flink SQL整合Hive分析搜狗用户搜索日志
    ) w  P9 u3 d, m6 S% k
  • 5.11 案例分析:Flink SQL实时单词计数
    & R0 v/ Q& H0 P$ j
  • 5.12 案例分析:Flink SQL实时计算5秒内用户订单总金额8 v' [& f1 h' w$ g% @
  • 5.13 案例分析:微博用户行为分析0 X) L: P9 S  F1 Q# Y
  • 5.13.1 离线与实时计算业务架构
    2 O, p" f/ q7 |9 M
  • 5.13.2 Flume数据采集架构  I3 o! B% S. a5 B6 Q5 D5 J
  • 5.13.3 Kafka消息队列架构
    % {) q6 B; q: ?  O6 v, A2 P% O
  • 5.14 案例分析:Flink SQL智慧交通数据分析
    ' s) r* i1 W1 _+ O, \
  • 5.14.1 项目介绍
    8 [8 b7 D, {; J( }+ t; e8 J/ @
  • 5.14.2 数据准备
    # `- O# Y* I4 Y5 S
  • 5.14.3 统计正常卡口数量! S7 O2 h3 U0 P8 o/ \8 `" I. y6 I
  • 5.14.4 统计车流量排名前3的卡口号
    ' U3 T8 T* {+ {) B3 b: R; j
  • 5.14.5 统计每个卡口通过速度最快的前3辆车) T' ]5 x9 Z+ l3 C- O( S
  • 5.14.6 车辆轨迹分析
    3 s/ z& d% D; O: I1 `# U
  • 第6章 Flink内核源码3 |- ]& W5 _3 Z7 s0 N3 L
  • 6.1 流图
    ; S+ e0 W9 @; E- A% m% A+ i
  • 6.1.1 StreamGraph核心对象$ `# G! x  n! t( J; [$ |3 `
  • 6.1.2 StreamGraph生成过程
    $ L$ j8 K, z& u' Y# x
  • 6.2 作业图
    ! g1 i+ I' x6 U
  • 6.2.1 JobGraph的核心对象; B$ m  ?, C9 S) O
  • 6.2.2 JobGraph的生成过程
      i- K- L- g  e- D6 g3 L" J
  • 6.3 执行图! p) U) \* `: U
  • 6.3.1 ExecutionGraph的核心对象
    4 _  D+ ]# l% r1 y. {7 j
  • 6.3.2 ExecutionGraph的生成过程$ G# u- V# y  c5 I  ^) E
  • 第7章 Gelly图计算* F* V8 l4 S4 p. \
  • 7.1 什么是Gelly
    ! `, F7 X5 P  i+ r( j  R
  • 7.2 第一个Gelly程序7 j# K* p7 c4 \: W1 r4 n. P
  • 7.3 Gelly数据结构2 S3 f2 ~. h- P* O% \1 X6 V
  • 7.4 如何使用Gelly
    * T# ]6 i5 O% V; _7 A
  • 7.5 图操作
    ) x( y0 q% Q6 w* \( K1 J; l% ?; L
  • 7.5.1 基本操作: b7 D( J- C  o  r) h
  • 7.5.2 属性操作) c! N- B  X2 I! u/ {* [* v! {
  • 7.5.3 结构操作( d: j/ \: y5 d$ f1 s8 d
  • 7.5.4 连接操作8 d3 }5 }2 T: l4 {- @1 d! R
  • 7.6 图常用API
    0 G- T' P# n3 W5 X. \
  • 7.6.1 创建图
    / R2 m/ K- ~0 t3 X8 X7 L7 @
  • 7.6.2 图的转换( F, R' E( y1 h8 n1 ~
  • 7.6.3 图的添加与移除& V0 i3 |& h% c
  • 7.6.4 图的邻域方法7.7 案例分析:Gelly计算社交网络中粉丝的平均年龄2 o( x' g7 S0 r1 r& Z4 m8 E
2 P; W+ ?7 i/ ]1 b3 F* V

* {( D2 P0 V! F
6 I4 }: B8 {, N1 Y7 b6 m' k- `) S( r  n" D/ S$ S
4 t1 Y2 s' t' T

$ o" J+ t- w( _2 P侵权联系与免责声明1、本站资源所有言论和图片纯属用户个人意见,与本论坛立场无关
. H, P5 ~5 @6 M6 Y3 _* u3 Q2、本站所有资源收集于互联网,由用户分享,该帖子作者与瑞客论坛不享有任何版权,如有侵权请联系本站删除
6 b! a' J' ?) r& x- O0 Y3、本站部分内容转载自其它网站,但并不代表本站赞同其观点和对其真实性负责1 S$ l" `4 s/ \& u# m( X
4、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意! ~$ n. y: i6 I/ k6 e- ]* g  Y
如有侵权联系邮箱:ruikelink@gmai.com
. P2 M; h2 Q/ ]  p7 I" F; `资源下载地址和密码(百度云盘):
游客,如果您要查看本帖隐藏内容请回复
[/hide] 百度网盘信息回帖可见& a( ]$ ?4 W% `: j8 N

$ ^. V4 |5 J% C3 L% @) H$ _) S! E* p2 C' G9 n" I. v* }
2 k% N2 E3 g$ M) L
本资源由Java自学网收集整理【www.javazx.com】
回复

使用道具 举报

该用户从未签到

6

主题

174

帖子

354

积分

普通会员

Rank: 2

积分
354
发表于 2024-8-7 12:40:15 | 显示全部楼层
不错好资源 可以用
回复 支持 反对

使用道具 举报

该用户从未签到

5

主题

193

帖子

377

积分

普通会员

Rank: 2

积分
377
发表于 2024-8-7 12:49:44 | 显示全部楼层
看到这帖子真是高兴!
回复 支持 反对

使用道具 举报

该用户从未签到

6

主题

164

帖子

326

积分

普通会员

Rank: 2

积分
326
发表于 2024-8-7 12:56:34 | 显示全部楼层
强烈支持楼主ing……
回复 支持 反对

使用道具 举报

该用户从未签到

5

主题

172

帖子

347

积分

普通会员

Rank: 2

积分
347
发表于 2024-8-7 13:00:30 | 显示全部楼层
强烈支持楼主ing……
回复 支持 反对

使用道具 举报

该用户从未签到

8

主题

163

帖子

330

积分

普通会员

Rank: 2

积分
330
发表于 2024-8-7 13:04:59 | 显示全部楼层
强烈支持楼主ing……
回复 支持 反对

使用道具 举报

该用户从未签到

3

主题

163

帖子

305

积分

普通会员

Rank: 2

积分
305
发表于 2024-8-7 13:11:28 | 显示全部楼层
强烈支持楼主ing……
回复 支持 反对

使用道具 举报

该用户从未签到

9

主题

174

帖子

353

积分

普通会员

Rank: 2

积分
353
发表于 2024-8-7 13:19:32 | 显示全部楼层
强烈支持楼主ing……
回复 支持 反对

使用道具 举报

该用户从未签到

9

主题

152

帖子

313

积分

普通会员

Rank: 2

积分
313
发表于 2024-8-7 13:29:26 | 显示全部楼层
强烈支持楼主ing……
回复 支持 反对

使用道具 举报

该用户从未签到

4

主题

177

帖子

356

积分

普通会员

Rank: 2

积分
356
发表于 2024-8-7 13:32:00 | 显示全部楼层
强烈支持楼主ing……
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Java自学网

GMT+8, 2025-4-2 18:44 , Processed in 0.129356 second(s), 29 queries .

Powered by Javazx

Copyright © 2012-2022, Javazx Cloud.

快速回复 返回顶部 返回列表