|
java自学网(www.javazx.com)-java论坛,java电子书推荐:《Storm实时数据处理》% \; g P1 c+ ]7 x0 ^. n
java电子书推荐理由:本书通过丰富的实例,系统讲解Storm的基础知识和实时数据处理的最佳实践方法,内容涵盖Storm本地开发环境搭建、日志流数据处理、Trident、分布式远程过程调用、Topology在不同编程语言中的实现方法、Storm与Hadoop的集成方法、实时机器学习、持续交付和如何在AWS上部署Storm。Hadoop无疑是最炙手可热的技术。作为分布式系统架构,Hadoop具有高可靠性、高扩展性、高效性、高容错性和低成本的优点。; p* o9 y% u4 K9 O' v
& d4 W6 `1 I7 c Q
8 O# ?. i0 w! {- d- i作者:(澳)安德森,卢誉声3 C2 a- }. D0 V; O6 Z, n7 P
出版社:机械工业出版社
& H2 b% ]$ o9 v/ b8 d" g9 d# D出版时间:2014-6-1
% m% a) |: |9 f, r6 {6 I R( q5 O4 g1 f
( y* J& D( x2 l0 f# }$ f6 p1 ~
% y' E: w: M. `. F$ {- Z; s
- g" o- ?2 f: M; |1 T$ Z
6 i5 U H. E( f S) l% f6 ojava电子书目录:
5 E1 |3 H% i, B第1章 搭建开发环境
0 E$ w* ^: v* F9 L& w1.1 简介
! b) v r* X% ], o$ C) R1.2 搭建开发环境3 f6 @+ R' C0 ?9 `6 d
1.3 分布式版本控制0 C1 b4 B7 }1 \4 U6 Y( V- l% K! M
1.4 创建“Hello World”Topology9 }; I; p* c% A
1.5 创建Storm集群——配置机器
7 e) x; f. f( a* k, b3 E1.6 创建Storm集群——配置Storm/ \* H; [. c6 |, R9 u* s
1.7 获取基本的点击率统计信息- }3 W8 [5 ^* e5 y/ e8 B
1.8 对Bolt进行单元测试9 l2 L- K2 F% y) T# K+ l
1.9 实现集成测试
N! w1 h* V) B% ?! l, ^4 m1.10 将产品部署到集群3 o. P* E6 |2 ?4 e
第2章 日志流处理
& z6 J0 J" `9 H5 y# p2.1 简介9 t- t `7 c4 `( _
2.2 创建日志代理4 l p& U: [3 x8 g x! z
2.3 创建日志Spout+ `9 @1 j+ w; u- k# x/ C: k$ W4 S
2.4 基于规则的日志流分析( C" P' K, ]! i2 n: I: l; Q- q, w
2.5 索引与持久化日志数据9 ]& n0 i( r7 A# a: k/ _0 p5 q9 B
2.6 统计与持久化日志统计信息
2 x$ E: h, R+ F: P2 d m2.7 为日志流集群创建集成测试- t, T# ]2 J8 B i* k
2.8 创建日志分析面板
6 a7 V/ {/ D( v第3章 使用Trident计算单词重要度
2 T7 Q; h' ^2 j4 q3.1 简介) W* t. t, a/ c+ b& d
3.2 使用Twitter过滤器创建URL流6 {& V# {0 [; d5 G
3.3 从文件中获取整洁的词流
2 A+ f! B2 R( `5 w7 c3.4 计算每个单词的相对重要度7 V: e: k& Z7 A9 z- t' [: b
第4章 分布式远程过程调用
5 @- f" |) c( W$ |4.1 简介
- @' }: S4 s' ~8 ` L3 p' \ W4.2 通过DPRC实现所需处理流程3 {& F/ Z, U( s8 r
4.3 对Trident Topology进行集成测试
$ H K/ k: D1 E4.4 实现滚动窗口Topology
0 B( y3 a6 H8 Z6 C9 r8 ]4.5 在集成测试中模拟时间
) M* L! ?* z8 I" R/ x3 p第5章 在不同语言中实现Topology. C$ h G, x* A1 t) O
5.1 简介
6 g L+ O& ^( Z9 W5.2 在Qt中实现多语言协议* d+ t. M6 t5 Z2 g, L. @
5.3 在Qt中实现SplitSentence Bolt
3 e; R! Q9 r H# q" b) i5.4 在Ruby中实现计数 Bolt
! V) x( x& c$ n K0 t# m5 R; x5.5 在Clojure中实现单词计数Topology
" D) t- A. m. t2 i第6章 Storm与Hadoop集成
! d: e# h8 `4 d8 ?( W* t; ?4 s' ?6.1 简介
9 J# ~% n. M& d' I. l# ` z7 H- I6.2 在Hadoop中实现TF-IDF算法
& A! j; p$ p! }$ D3 W* A2 G6.3 持久化来自Storm的文件9 w% X& q0 R# o$ f* i; x
6.4 集成批处理与实时视图
& V5 H; ^) ^% q' S; T9 {第7章 实时机器学习
1 N K8 F) b1 @7.1 简介
8 _# X" T* @ d/ f! c6 I5 f5 A3 ~7.2 实现事务性Topology
( x; P$ Q3 y' i8 c+ z; O0 a7.3 在R中创建随机森林分类模型
& {3 Y$ o: ]6 |8 B3 k4 J7 s( {( ^7.4 基于随机森林的事务流业务分类1 E6 u) B, ~0 M; Z! F
7.5 在R中创建关联规则模型
$ f; g+ B: x; A+ T& w5 ^7.6 创建推荐引擎
- ~, y1 F3 [! W/ L3 O/ U1 e7.7 实时在线机器学习3 J$ \9 u6 a- x" `4 m# R
第8章 持续交付
. ?! @) A6 P, C0 s5 s8.1 简介
5 A' U( X) b+ M/ L8.2 搭建CI服务器
3 j* K% ?, J7 O. @+ B( H$ W1 P* T8.3 搭建系统环境9 F' v* e% X/ V. p0 _) Q
8.4 定义交付流水线
1 y. ^6 n. @. `, ?9 }: F8.5 实现自动化验收测试! [+ q% u: ^% ^6 ^3 c
第9章 在AWS上部署Storm- P( M# K% x$ ~7 W/ a; t0 I8 K+ Z
9.1 简介& Z, p6 Z6 c F% d7 T' W5 q: N/ ?
9.2 使用Pallet在AWS上部署Storm
3 H; f9 ~* ~* V9.3 搭建虚拟私有云
; i! @, N5 a* c+ l- }0 N9.4 使用Vagrant在虚拟私有云上部署Storm
4 d! v) G; k0 w: R- y/ e$ t) z2 I8 u
: \: K8 ]* E. Z( }' a1 j" [8 _
百度网盘下载地址链接(百度云):java自学网(javazx.com)Storm实时数据处理 PDF 高清 电子书.zip【密码回帖可见】. F0 [7 y5 b! Y8 P
W, a$ u& K5 k( `) O2 a1 W/ X4 o
! N3 A- \: g" n! x+ o
& ?4 s4 @/ j Z. s: f
|
|