Yarn架构
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,Yarn是为了解决MRv1中JobTracker负载过重,而设计的第二代MR运行架构。yarn是个master/slave结构,master节点运行Resourcemanager,slave节点运行n
千家信息网最后更新 2025年12月02日Yarn架构
Yarn是为了解决MRv1中JobTracker负载过重,而设计的第二代MR运行架构。
yarn是个master/slave结构,master节点运行Resourcemanager,slave节点运行nodemanager。
- RM主要有两个组件:资源调度器(scheduler)和应用程序管理器(Applications Manager)
scheduler主要进行资源调度,不进行任何与应用程序相关的动作,主要包括Capacity Scheduler和Fair scheduler。
ASM:主要负责提交、启动以及监控每个application的application master - AM
每个作业都有一个application master来监控和管理自己的所有任务,具备的功能包括:
a,与RM交互获取任务运行的资源;
b,与NM交互提交任务、监控任务运行情况等 - NM
一般集群中每个节点启动一个NM,NM不但向RM发送心跳,汇报本节点的资源使用情况;并与AM交互,接收并处理来自AM的所有关于container的请求。 - container
一个逻辑概念,抽象的资源表示形式,可以代表一组多维度资源,目前yarn主要支持cpu和内存。
yarn工作流程
向yarn提交一个应用程序后,yarn主要分为两个步骤:第一步先启动application master;第二步由AM启动并监控本application中的所有任务,直到完成。
- 向yarn提交应用程序,包含application master程序,以及启动am的命令;
- RM为AM分配一个container,并与NM通信启动container来运行这个AM(这是唯一一个由RM和NM通信启动的container,其它的container都是AM与NM通信启动)
- AM启动之后,主动向RM发送心跳注册自己,此时RM可以监控这个AM,我们可以在yarn web页面上看到这个任务;
- AM轮询方式向RM申请和获取资源;
- AM获取到资源后,与NM通信要求启动任务;
- NM设置任务运行环境,启动任务;
- 各个NM上的任务,不断通过RPC向AM发送心跳,汇报自己的状态和进度;
- 任务全部完成后,AM向RM注销自己。
任务
资源
运行
程序
监控
应用程序
节点
应用
通信
两个
情况
汇报
管理
调度
架构
主动
不断
代表
内存
功能
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
巨灵鸟5000数据库
中国网络安全大赛人员
软件开发公司部门
web服务器带宽
建立access数据库
服务器代付
网络安全法百度题库及答案
嗯网络安全生的作文
文件审计服务器
风吉网络技术有限公司
数据库的发展与应用
计算机信息网络安全包括
徐州企业软件开发中心
苹果怎么下载安卓服务器游戏
优酷 流媒体服务器
邮政寄递四大数据库是指什么
中国社科院 免费数据库
计算机网络技术里有什么专业
加大网络技术监管
计算机软件开发工作好找吗
宁波手机游戏软件开发价格
石景山区管理软件开发质量推荐
汽车数据库sql
命令连ora数据库语句
长宁区app软件开发流程
控制端软件开发
德州德勤网络技术有限公司
数据库取数据进行分析
suma服务器安装centos
wow暗影裂口服务器