网易游戏FairScheduler迁移CapacityScheduler实践|电子爱好者

admin管理员组
文章数量:1606665

一、背景

我们的海外集群上线spot动态节点后，由于动态节点不定期会被回收，为了保证作业运行稳定性，需要指定某些重点作业运行在固定节点，而这需要使用到CapacityScheduler的NodeLabel功能。虽然社区也有FairScheduler支持NodeLabel的patch（YARN-2497），但并不成熟，不适合在生产环境使用。

此外，目前社区的开发重点也偏向CapacityScheduler，随着版本的更新，它对于调度吞吐量做了众多改进，比如多线程调度、细粒度锁等。经过讨论后，我们决定将目前使用的FairScheduler切换为CapacityScheduler。

二、集群现状

目前我们的海外集群队列数800+，每天提交约18万个Hive、Spark等作业，我们需要在用户无感知情况下将调度器切换成CapacityScheduler，兼容调度器之间的功能差异，并保障集群调度性能。

三、配置转换

除了将yarn.resourcemanager.scheduler.class 配置为CapacityScheduler外，我们重点需要将队列配置fair-scheduler.xml转换为capacity-scheduler.xml，因为两者的配置方式差异较大，结合社区的资料（YARN-9698），我整理出一些关键配置的映射关系：

FairScheduler配置	CapacityScheduler配置	配置说明
`minResources`	`yarn.scheduler.capacity.<queue-path>.capacity`	队列最小资源
`maxResources`	`yarn.scheduler.capacity.<queue-path>.maximum-capacity`	队列最大资源
`aclSubmitApps`	`yarn.scheduler.capacity.<queue-path>.acl_submit_applications`	队列提交授权
`aclAdministerApps`	`yarn.scheduler.capacity.<queue-path>.acl_administer_queue`	队列管理授权
`maxAMShare`	`yarn.scheduler.capacity.<queue-path>.maximum-am-resource-percent`	AM资源限额管理
`queueMaxAppsDefault`	`yarn.scheduler.capacity.<queue-path>.maximum-applications`	最大apps限制
`maxRunningApps`	`yarn.scheduler.capacity.<queue-path>.max-parallel-apps`	最大运行apps限制
`maxContainerAllocation (“X mb, Y vcores”)`	`yarn.scheduler.capacity.<queue-path>.maximum-allocation-mb` `yarn.scheduler.capacity.<queue-path>.maximum-allocation-vcores`	container最大资源
`yarn.scheduler.fair.preemption`	`yarn.resourcemanager.scheduler.monitor.enable`	是否开启抢占，默认值为false
`yarn.scheduler.fair.allow-undeclared-pools`	`yarn.scheduler.capacity.<queue-path>.auto-create-child-queue.enabled`	是否允许自动创建队列，FS默认为true，CS默认为false
`yarn.scheduler.fair.user-as-default-queue`	`yarn.scheduler.capacity.queue-mappings`	用户队列映射，FS默认为true

值得一提的是，在Hadoop 3.3.0版本，yarn提供了一个命令行工具来进行配置转换，使用方式如下：

yarn fs2cs -y /path/to/yarn-site.xml [-f /path/to/fair-scheduler.xml] {-o /output/path/ | -p} [-t] [-s] [-d]

但目前这个工具还不完善，我在试用过后发现有很多参数不支持转换，比如：

<userMaxAppsDefault> – default maximum applications per user
<minResources> – minimum resources for a queue
<maxResources> – maximum resources for a queue

最终我选择自己写脚本完成配置文件的转换，这个过程中遇到一些CapacityScheduler队列配置需要重点注意的地方：

1、资源计算器
yarn.scheduler.capacity.resource-calculator：资源计算器用于在调度器中比较资源。
默认值是 org.apache.hadoop.yarn.util.resource.DefaultResourseCalculator，只使用内存进行比较，而我们的集群中需要同时限制用户对内存和vcore的使用，所以需要将该参数设置为org.apache.hadoop.yarn.util.resource.DominantResourceCalculator。

2、排序策略
yarn.scheduler.capacity.<queue-path>.ordering-policy：用于决定资源分配顺序。该参数的配置分为对父队列和对叶子队列，对父队列配置时，用于对该队列的子队列进行排序，可选值有 utilization 和 priority-utilization，默认是 utilization；
对叶子队列配置时，用于对该队列内的作业进行排序，可选值有fifo 和 fair，默认是fifo。
两者的配置值不能混淆，如果父队列配置了fifo 或 fair，则会报错。

3、队列有效资源
由于使用FairScheduler时队列配置的是绝对资源&

本文标签：网易游戏 CapacityScheduler FairScheduler

版权声明：本文标题：网易游戏FairScheduler迁移CapacityScheduler实践内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1728506956a1161489.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

网易游戏FairScheduler迁移CapacityScheduler实践

一、背景

二、集群现状

三、配置转换

更多相关文章

qq音乐专属格式转换_将网易云音乐专用的无损音乐格式转换成全平台通用的无损格式...

「游戏资产上链」毫无价值？

雄踞AppStore榜首的游戏&lt;别踩到白块儿&gt;源代码分析和下载(一)

游戏鼠标的dpi测试软件,普通鼠标怎么调dpi_怎么测鼠标dpi-win7之家

计算机玩什么游戏都闪退,为什么游戏会闪退_电脑玩游戏老是闪退怎么办-win7之家...

【Linux】安装 Ubuntu18.04 全程实录(安装 NVIDIA 驱动，安装主题美化，安装应用程序，网易云无法启动，GoldenDict 音标显示不正常)

使命召唤ios_使命召唤竞争性多人游戏未来引发争议

无法启动游戏 因为计算机,WeGame只需五步即可解决游戏无法启动的问题！

解决《辐射4》游戏启动故障：深入剖析0xc0000142错误代码

反编译网易云音乐Android App

游戏交易系统设计与实现

amtemu v0.9.2怎么用_怎么样用手机玩暗黑2（电脑PC游戏）

小李的计算机配置有8g内存,2019大内存游戏电脑主机配置单推荐不到2500元！

《游戏设计艺术（第二版）》第八章个人学习

【CTF】Misc5——隐写3+做个游戏+想蹭网先解开密码+Linux2

游戏服务器会使用http协议,HTTPS协议要比HTTP多用多少服务器资源？

Unity 游戏移植到 Windows10

游戏党福音，Google play游戏明年登录Windows

（2024—1.08~1.14）Google play全球及各个地区游戏应用下载排行榜

安装googleplay 游戏后，提示需要将google play 服务更新到最新，但是已经是最新的了

发表评论

推荐文章

Android Q RILJ Construction

windows计算机没有网络适配器,Win10 1909专业版中没有网络适配器解决方法

vc6.0（完整绿色版）（支持XP、Win7、Win8、Win10）

Windows网络问题：局域网内电脑连接wifi连不上

物联网导论整理

热门文章

美国股市入门二

CAD安装1606错误could access network location AutoDeskAutoCAD2021R24.0

东静给排水CAD绘图辅助软件（LBJ2019）

Imx6ull智能车载平台基于alsa的mplayer的音视频播放器

Springboot计算机毕业设计音乐播放系统mx104

计算机组成原理408新增固态硬盘

学习Python编程的十大资源

2020年最新在线CRM免费下载

使用Navicat Premium连接本地数据库

android系统最新版本更新,安卓8.0系统最新下载安装

最新文章

分享5款好用的PDF阅读器，让PDF阅读更轻松

修改完pip的默认路径，pip install 仍然显示在C盘

python恢复手机数据的软件_有什么万能的手机数据恢复软件吗？

manjaro linux必装工具,Manjaro Linux 环境安装和软件清单

暗夜精灵5安装Manjaro 18.1.0 Juhraya

Linux常用PDF阅读软件

如何在计算机配置里面设置隐藏c盘,如何设置C盘禁止安装任何软件？3种方法，让你电脑5年不卡顿...

电脑突然显示只有C盘，其他磁盘不显示了----解决方法（很简单）

站台「亚马逊云科技中国峰会」，我成了「开发者大讲堂」演讲嘉宾~

各大U盘主控有何区别

win11更新之后微软商店下载不了软件怎么办

计算机硬盘里没有内容却显示有,为什么电脑磁盘里头明明没有东西,也没隐藏文件,却显示用了12个G。求解!...

计算机d盘打开不显示,为何我打开电脑D盘显示不出任何东西来?

android手机文件误删除恢复软件,被误删除的文件用安卓手机数据恢复软件怎么找回...

【测试】 FIO：ceph磁盘IO测试工具 fio（iodepth深度）

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

雄踞AppStore榜首的游戏<别踩到白块儿>源代码分析和下载(一)

无法启动游戏因为计算机,WeGame只需五步即可解决游戏无法启动的问题！

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载