java自学网VIP

Java自学网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2979|回复: 0

《深入解析YARN架构设计与实现原理》第2章 YARN设计理念与基本架构【2.6】

[复制链接]
  • TA的每日心情
    开心
    2021-5-25 00:00
  • 签到天数: 1917 天

    [LV.Master]出神入化

    2025

    主题

    3683

    帖子

    6万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    66265

    宣传达人突出贡献优秀版主荣誉管理论坛元老

    发表于 2017-4-14 11:06:08 | 显示全部楼层 |阅读模式
    2.6 多角度理解YARN5 T/ s% u( S, q
    下面我从并行编程、 资源管理、 云计算等三个角度帮助读者理解YARN1 f* ?, o, k5 K3 F* ^0 q
    2.6.1 并行编程
      W2 l+ ^$ m5 p2 Y# l( D
    在单机程序设计中, 为了快速处理一个大的数据集, 通常采用多线程并行编程, 如图2-12所示, 大体流程如下: 先由操作系
    5 Z% D! g* D6 A, f统启动一个主线程, 由它负责数据切分、 任务分配、 子线程启动和销毁等工作, 而各个子线程只负责计算自己的数据, 当所有子) Q+ j  \: [; R2 I9 o8 @
    线程处理完数据后, 主线程再退出。 类比理解,
    YARN上的应用程序运行过程与之非常相近, 只不过它是集群上的分布式并行编. B+ W, g4 O) {$ q* p
    程。 可将
    YARN看做一个云操作系统, 它负责为应用程序启动ApplicationMaster( 相当于主线程) , 然后再由ApplicationMaster负责+ j' t/ Z; P$ M
    数据切分、 任务分配、 启动和监控等工作, 而由
    ApplicationMaster启动的各个Task( 相当于子线程) 仅负责自己的计算任务。 当所
      [2 b2 w5 L, q有任务计算完成后,
    ApplicationMaster认为应用程序运行完成, 然后退出。
    ( m4 C+ ]1 H6 m) A+ v2 c
    2.6.2 资源管理系统
    6 O, c8 o- W5 c6 I
    资源管理系统的主要功能是对集群中各类资源进行抽象, 并根据各种应用程序或者服务的要求, 按照一定的调度策略, 将资
    . u; c9 E- [0 }  S4 d3 ~( @; X源分配给它们使用, 同时需采用一定的资源隔离机制防止应用程序或者服务之间因资源抢占而相互干扰。
    YARN正是一个资源管
    4 Z  ^, ]# t" K理系统, 它的出现弱化了计算框架之争, 引入
    YARN这一层后, 各种计算框架可各自发挥自己的优势, 并由YARN进行统一管3 L6 ~* h+ `9 P$ G! y6 t
    理, 进而运行在一个大集群上。 截至本书出版时, 各种开源系统都在开发
    YARN版本, 包括MapReduceSparkStormHBase
    6 Y" G/ d# ?4 P6 Y5 l& Z. T- f7 V6 M
    等。
    , G4 L& y9 f0 Q/ A
    2-12 从并行编程角度理解YARN6 ]4 O2 O! w. i3 Z* @. X: D
    2.6.3 云计算$ m! E& a: V- P9 @
    普遍认为, 云计算包括以下几个层次的服务: IaaSPaaSSaaS。 这里所谓的层次, 是分层体系架构意义上的层次
    1 i! r: s3 Z' \! R7 o2 d
    IaaSPaaSSaaS分别实现在基础设施层、 软件开放运行平台层、 应用软件层。
    # K6 M' K' I* }+ I9 z# C
    IaaS(Infrastructure-as-a-Service): 基础设施即服务。 消费者通过Internet可以从完善的计算机基础设施获得服务。 Iaas通过网络向
    + }! l3 l% R$ R1 S* c# c用户提供计算机( 物理机和虚拟机) 、 存储空间、 网络连接、 负载均衡和防火墙等基本计算资源; 用户在此基础上部署和运行各

    ' N) P  u6 ~" g, [种软件, 包括操作系统和应用程序等。/ \7 A- o) C( h5 X0 _
    PaaS(Platform-as-a-Service): 平台即服务。 PaaS是将软件研发的平台作为一种服务, 以SaaS的模式提交给用户。 平台通常包括
    # \% G2 y2 w3 ~6 s/ i& D操作系统、 编程语言的运行环境、 数据库和
    Web 服务器等, 用户可以在平台上部署和运行自己的应用。 通常而言, 用户不能管
    0 c/ i8 o1 v, k理和控制底层的基础设施, 只能控制自己部署的应用。
    3 i6 B, u. `7 q  m. ]" Y
    SaaS(Software-as-a-Service): 软件即服务。 它是一种通过Internet提供软件的模式, 用户无需购买软件, 而是向提供商租用基4 \0 q9 G- {9 K# A. q
    Web的软件, 来管理企业经营活动。 云提供商在云端安装和运行应用软件, 云用户通过云客户端( 比如Web 浏览器) 使用软7 l, c$ V( C8 ~, T/ M6 T1 q
    件。
      . [8 t2 w5 p" E" }6 P- |
    1 `8 m" M+ F0 b# |# J
    7 `" N* S7 @4 Z, O7 A
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|Archiver|手机版|小黑屋|Java自学网

    GMT+8, 2024-9-8 09:37 , Processed in 0.112446 second(s), 31 queries .

    Powered by Javazx

    Copyright © 2012-2022, Javazx Cloud.

    快速回复 返回顶部 返回列表