|
2.7 本书涉及内容9 q( G% [$ e1 x& C2 Z) Q. c
本书的主要内容可用图2-13表示, 主要涉及两部分内容, 一个是YARN涉及的理念与实现, 该部分内容将在第二部分中介* Y+ @# x0 ?% s$ @
绍。 另一个是运行于YARN之上的比较有名的开源框架, 包括MapReduce、 Tez、 Storm和Spark, 其中MapReduce、 Tez和Spark是以) x' G! i( [7 m! a, A' M, E
短应用程序的形式直接运行在YARN之上; 而Storm则不同, 它是以服务的形式运行在YARN上, 用户编写的Topology( 即为Storm
/ h8 E" C! d- y1 t1 x/ ]5 p' _应用程序, 类似于MapReduce作业, 将在第10章介绍) 则运行在Storm服务中, 该部分内容将在第三部分中介绍。2.8 小结
; T: g0 Q. p8 k: k! B本章介绍了YARN的设计理念和基本架构, 涉及到的内容较多, 包括YARN产生背景、 Hadoop术语解释和版本变迁、 YARN3 t3 ]3 m1 b6 c7 F
架构和通信协议等。 从编程模型角度看, YARN与传统并行编程模式非常像, 但兼具了分布式和并行两个特点; 从资源管理系统
0 a) a$ C& P; c( `0 \+ h角度看, YARN将扮演为上层计算框架提供计算资源的角色; 从云计算角度看, YARN可看做轻量级的PAAS层。
$ c8 n* J& k; F& E- H在后面几章中, 我们将深入探讨YARN内部实现原理, 以便让读者进一步深层次理解YARN。
3 y3 e- X/ f" i6 c
: G9 @ X; J4 m& O$ `3 ?4 }$ G$ p7 u7 k" l. J3 P6 u* C4 @; [) h
|
|