|
java自学网(www.javazx.com)-java论坛,java电子书推荐:《Storm实时数据处理》3 ]3 m0 q `, ?. {# w7 p) J) Z
java电子书推荐理由:本书通过丰富的实例,系统讲解Storm的基础知识和实时数据处理的最佳实践方法,内容涵盖Storm本地开发环境搭建、日志流数据处理、Trident、分布式远程过程调用、Topology在不同编程语言中的实现方法、Storm与Hadoop的集成方法、实时机器学习、持续交付和如何在AWS上部署Storm。Hadoop无疑是最炙手可热的技术。作为分布式系统架构,Hadoop具有高可靠性、高扩展性、高效性、高容错性和低成本的优点。6 K: t: ?: x4 c# u# z2 q" P e o
1 n$ Q% Y" C: G' Z2 u, d& q b: G
! s5 E" \! o3 r# G
作者:(澳)安德森,卢誉声
9 v- a. w, u. p2 J7 `出版社:机械工业出版社
% U1 D' g" c8 s& G3 x2 @出版时间:2014-6-1
4 `5 P! t; _$ Z1 l+ s9 a$ Q6 h3 G# S; U9 d* v$ |2 E, T* Q
: j6 G) T7 h7 G5 k- {4 W' {$ ?% Q
5 ]; l% \8 S8 j) K4 h- s1 f
; d& u' o5 z$ \5 e3 \7 F( P3 l8 T2 C9 j$ c2 \
java电子书目录:
1 P% b7 G1 H r第1章 搭建开发环境4 q+ K' s6 ]: F+ Y J7 J0 V
1.1 简介! Q& q: r1 F2 |3 V- y# R/ W% h
1.2 搭建开发环境: f; K1 c5 y/ X8 z; M# q, z
1.3 分布式版本控制
5 @7 p$ X) L) o: X p- p6 }; n1.4 创建“Hello World”Topology6 J l& x/ B8 B
1.5 创建Storm集群——配置机器
6 G: Q7 | D: `1.6 创建Storm集群——配置Storm
4 G) ~" t: b9 V, J; L1.7 获取基本的点击率统计信息4 Q- }4 _5 j" u
1.8 对Bolt进行单元测试
0 ~! y+ U- q0 t* \1.9 实现集成测试8 G% m( W* E$ O: V `& u
1.10 将产品部署到集群9 p4 B, f: f0 O# p% m
第2章 日志流处理
; l4 ~3 U9 }2 o% x( P2.1 简介
: q: A6 X. K: P. [2.2 创建日志代理/ X9 j, L; K; F
2.3 创建日志Spout
9 p2 G! d0 F! i3 N1 S; a2.4 基于规则的日志流分析; k- q% V7 B, m
2.5 索引与持久化日志数据
3 d" R; O( a0 i4 [% F) k; {2.6 统计与持久化日志统计信息
. V0 Z/ k- s8 J9 U2.7 为日志流集群创建集成测试; Q8 D' p3 m" R6 P
2.8 创建日志分析面板
/ o" R' j1 L1 ^第3章 使用Trident计算单词重要度
5 n! Y* l' v, m5 b; J3.1 简介* g$ u9 v B& ?; S
3.2 使用Twitter过滤器创建URL流0 s) e8 E8 u4 |& @$ J+ W, ^
3.3 从文件中获取整洁的词流
# g; e" N( H$ ]0 h3.4 计算每个单词的相对重要度
7 F; R9 o, u, p1 L5 q! f第4章 分布式远程过程调用
* [4 L5 w/ \2 c9 N4.1 简介
0 F& O( R5 }7 s& M+ k E2 X+ Y4 v4.2 通过DPRC实现所需处理流程
3 k0 q0 D% a, Q/ q4 O4.3 对Trident Topology进行集成测试
3 U: r: }8 ], d' F0 T4.4 实现滚动窗口Topology
2 d- Y5 c# P |5 }8 L* J4.5 在集成测试中模拟时间
/ b( v* k- ]; H4 @" ~% D" J第5章 在不同语言中实现Topology
2 ]* l% T I6 S2 I# U7 q2 V5.1 简介- ~. g P# b6 @9 v# X S$ B
5.2 在Qt中实现多语言协议
% ?$ L! B! H2 M; C4 z/ U9 v9 K5.3 在Qt中实现SplitSentence Bolt2 ^4 ~( i8 L0 x% T) f8 I
5.4 在Ruby中实现计数 Bolt
9 k7 Y4 Q. M1 h" g$ \5.5 在Clojure中实现单词计数Topology R" \4 b1 S& K* x. y( r- Z
第6章 Storm与Hadoop集成
/ F" j% S) K. z5 @& _/ \3 O2 O6.1 简介8 U( S( m+ M0 J% M. F- X
6.2 在Hadoop中实现TF-IDF算法' ~9 w% h3 r% h o1 I
6.3 持久化来自Storm的文件0 D4 }3 ^# g9 d
6.4 集成批处理与实时视图
* @) ~( X2 @+ a+ [( n- ^第7章 实时机器学习: c' a7 C* T, H! i
7.1 简介- x3 }. \- s6 E9 V* |; W* |
7.2 实现事务性Topology
9 q* e" V1 R: [1 D7.3 在R中创建随机森林分类模型
4 P+ { z l# y7.4 基于随机森林的事务流业务分类
; X" j) L. S( k& ]$ C" i( b/ U2 o/ M7.5 在R中创建关联规则模型% E! G8 R* s: }0 [+ @: O
7.6 创建推荐引擎3 g" E! ]" C! F
7.7 实时在线机器学习
* w" m1 Y' E6 y$ }1 p2 U$ O( T第8章 持续交付
7 t8 F5 D9 M* K' a0 u8.1 简介; w1 B9 V+ r- ~ \6 e
8.2 搭建CI服务器
- u5 S7 y `* V" _* y7 \) ]5 h8.3 搭建系统环境! Z$ _$ ^/ `0 }" y
8.4 定义交付流水线
9 G1 O- A- Y( A+ |7 x3 G% k# f J8.5 实现自动化验收测试( r' P1 d# U. c: X5 q6 F9 t! }1 [
第9章 在AWS上部署Storm
: B, z5 O i& k9 J8 g8 F9.1 简介/ y2 a8 Q$ P' ]7 w1 n
9.2 使用Pallet在AWS上部署Storm s- e% l& j' Y: Z: p) e
9.3 搭建虚拟私有云
1 t% k" @1 ]# _% r/ ~6 r: U9.4 使用Vagrant在虚拟私有云上部署Storm
" S, u I' ^" O2 w8 g. N1 ~9 Y h7 g* }+ q) ]9 f2 H
1 Q' T3 J) D' d百度网盘下载地址链接(百度云):java自学网(javazx.com)Storm实时数据处理 PDF 高清 电子书.zip【密码回帖可见】
% R5 ?' B& P! u% k B8 e/ r7 L
2 s$ O2 p7 j' m. {
9 {' }6 S3 n/ T+ P# P+ _: s |
|