hadoop Capacity Scheduler解析|电子爱好者

admin管理员组
文章数量:1612060

计算能力调度器算法
总结

为什么有计算能力调度器
克服现有单一队列fifo 性能低效问题,适合于多用户共享集群的环境的调度器
好比说部署一个hdfs有不同的用户在记录数据并进行分析,需要按用户级别进行集群资源使用的控制
也可以简单这么理解有dfs 和mine 2帐号进行任务的提交,可以控制这2个用户的集群资源使用率

Capacity Scheduler支持以下特性
1. 支持多个队列，某个作业可被提交到某一个队列中(默认只有一个命名为default的队列)。每个队列会配置一定比例的计算资源，且所有提交到队列中的作业共享该队列中的资源。
2. 空闲资源会被分配给那些未达到资源使用上限的队列，当某个未达到资源的队列需要资源时，一旦出现空闲资源资源，便会分配给他们
3.队列支持作业优先级调度（默认是FIFO）默认不支持优先级,需要配置
mapred.capacity-scheduler.queue. queueName .supports-priority***************************************************************************
3. 计算能力调度器算法分析
在capacity中，存在三种粒度的对象，分别为：queue、job和task，它们均需要维护的一些信息：
(1) queue维护的信息
@ queueName：queue的名称
@ ulMin：每个用户的可用的最少资源量（所有用户均相同），需用户在配置文件中指定
@ capacityPercent：计算资源比例，需用户在配置文件中指定
@ numJobsByUser：每个用户的作业量，用以跟踪每个用户提交的作业量，并进行数量的上限限制。
该队列中map 或reduce task的属性：
@ capacity：实际的计算资源量，这个随着tasktracker中slot数目变化（用户可能在添加或减少机器节点）而动态变化，大小为：capacityPercent*mapClusterCapacity/100
@ numRunningTasks：正在running的task数目
@ numSlotsOccupied：正在running的task占用的slot总数，注意，在Capacity Scheduler中，running task与slot不一定是一一对应的，每个task可获取多个slot，这主要是因为该调度支持内存资源调度，某个task可能需要多个slot包含的内存量。
@ numSlotsOccupiedByUser：每个用户的作业占用slot总数，用以限制用户使用的资源量。
(2) job维护的信息
priority：作业优先级，分为五个等级，从大到小依次为：VERY_HIGH，HIGH，NORMAL，LOW，VERY_LOW;
numMapTasks/ numReduceTasks ：job的map/reduce task总数
runningMapTasks/ runningMapTasks：job正在运行的map/reduce task数
finishedMapTasks/finishedReduceTasks：job已完成的map/reduce task数
……
(3) task维护的信息
task开始运行时间，当前状态等
3.2 计算能力调度算法
当某个tasktracker上出现空闲slot时，调度器依次选择一个queue、（选中的queue中的）job、（选中的job中的）task，并将该slot分配给该task。下面介绍选择queue、job和task所采用的策略：
（1）选择queue：将所有queue按照资源使用率（numSlotsOccupied/capacity）由小到大排序，依次进行处理，直到找到一个合适的job。
（2）选择job：在当前queue中，所有作业按照作业提交时间和作业优先级进行排序（假设开启支持优先级调度功能，默认不支持，需要在配置文件中开启），调度依次考虑每个作业，选择符合两个条件的job： [1] 作业所在的用户未达到资源使用上限 [2] 该TaskTracker所在的节点剩余的内存足够该job的task使用。
（3）选择task，同大部分调度器一样，考虑task的locality和资源使用情况。（即：调用JobInProgress中的obtainNewMapTask()/obtainNewReduceTask()方法）
算法分析部分取自网上先人的一些文章,对理解源代码有一定的思络帮助
capacity 算法的相关类不多
CapacitySchedulerConf.java：管理配置文件
CapacityTaskScheduler.java：调度器的核心代码
JobQueuesManager.java：管理作业队列
MemoryMatcher.java：用于判断job与内存容量是否匹配
JobInitializationPoller.java：作业初始化类，用户可同时启动多个线程，加快作业初始化速度。
相关的粒度的各种控制都在 CapacitySchedulerQueue 类进行控制
CapacityTaskScheduler 分析
（a）CapacityTaskScheduler.start()：调度器初始化，包括加载配置文件，初始化各种
对象和变量等。
（b）CapacityTaskScheduler.assignTasks()：当有一个 TaskTracker 的 HeartBeat 到达
JobTracker 时，如果有空闲的 slot，JobTracker 会调用 Capacity Scheduler 中的 assignTasks
方法，该方法会为该 TaskTracker 需找若干个合适的 task。
（c）TaskSchedulingMgr.assignTasks()：对外提供的最直接的调用函数，主要作用是为
TaskTracker 选择一个合适的 task，该函数会依次扫描系统中所有的 queue（queue 已经被
排好序，排序类为 TaskSchedulingMgr.QueueComparator，根据runningTasks/Capacity（indicates how much 'free space' the queue has）由小到大排列），对于每个 queue，调用getTaskFromQueue()。
（d）TaskSchedulingMgr.getTaskFromQueue()：从队列中选择一个符合条件的作业，
包括用户的资源量上限，TaskTracker 空闲内存等。
计算能力调度算法将作业以队列为单位进行划分，适合于多用户共享集群的情况。当
TaskTracker 出现空闲时，会根据计算能力调度算法依次选择队列、作业和任务。这种多队
列并行执行的方式可以提高系统资源的利用率以及系统的执行效率。

* hadoop Capacity Scheduler 实际如何运用
默认只有一个default队列需要增加队列

<name>mapred.queue.names</name>

<value>default,secondqueue</value>

</description>

</property>

设置调度算法

<name>mapred.jobtracker.taskScheduler</name>

<value>org.apache.hadoop.mapred.CapacityTaskScheduler</value>

<description>The class responsible for scheduling the tasks.</description>

</property>

设置capacity的细节参数
mapred.capacity-scheduler.queue.<queue-name>.property-name.
详见capacity-scheduler.xml

以capacity-scheduler.xml当前配置来说明算法的运行情况

这里设置了整个集群的承载量,及2队列的占用比率queue 占用85% secondqueue占用15%

<name>mapred.capacity-scheduler.maximum-system-jobs</name>

<description>Maximum number of jobs in the system which can be initialized, concurrently, by the CapacityScheduler. </description>

</property>

<name>mapred.capacity-scheduler.queue.default.capacity</name>

<description>Percentage of the number of slots in the cluster that are to be available for jobs in this queue. </description>

</property>

<name>mapred.capacity-scheduler.queue.secondqueue.capacity</name>

</property>

用于一个队列里的每个用户的平均量
<property>
<name>mapred.capacity-scheduler.queue.secondqueue.minimum-user-limit-percent</name>
<value>25</value>
</property>
队列最大吞吐量,相当用一个最大队列容量同时能容量多少任务
<property>
<name>mapred.capacity-scheduler.queue.secondqueue.init-accept-jobs-factor</name>
<value>3</value>
</property>

以上几个参数实现运行的情况如下

2011-09-11 15:07:00,705 INFO org.apache.hadoop.mapred.CapacityTaskScheduler: Initializing 'default' queue with cap=85.0, maxCap=-1.0, ulMin=100, ulMinFactor=1.0, supportsPriorities=false, maxJobsToInit=9, maxJobsToAccept=90, maxActiveTasks=200000, maxJobsPerUserToInit=9, maxJobsPerUserToAccept=90, maxActiveTasksPerUser=100000
2011-09-11 15:07:00,706 INFO org.apache.hadoop.mapred.CapacityTaskScheduler: Initializing 'secondqueue' queue with cap=15.0, maxCap=-1.0, ulMin=25, ulMinFactor=1.0, supportsPriorities=true, maxJobsToInit=2, maxJobsToAccept=6, maxActiveTasks=200000, maxJobsPerUserToInit=1, maxJobsPerUserToAccept=3, maxActiveTasksPerUser=100000

当前default的各项值是如何计算得出的

maxJobsToInit 当前queue的最大并发运行任务数
int maxJobsToInit = (int)Math.ceil(maxSystemJobs * capacityPercent/100.0);
9= 10*85%

maxJobsPerUserToInit 当前queue里的用户最大并发运行任务数
int maxJobsPerUserToInit =
(int)Math.ceil(maxSystemJobs * capacityPercent/100.0 * ulMin/100.0);

以secondqueue来说他的最大并发运行任务数是2 设了minimum-user-limit-percent =25 得出的
maxJobsPerUserToInit = 1

一个队伍的最大容量任务数是maxJobsToInit * init-accept-jobs-factor
int maxJobsToAccept = maxJobsToInit * jobInitToAcceptFactor;

那么按照配置 secondqueue的情况就是 queue支持任务优先级排序,队伍最大支持并发运行2个任务,最大能容量6个任务,相当于会有4个任务在waiting 状态，maxActiveTasks,maxActiveTasksPerUser指定任务运行过程中的最大task 参数直接指定
secondqueue 队伍中的用户单个用户最多能执行1个任务,单用户最多容量3个任务
当任务数量提交超过maxJobsToAccept或用户的maxJobsPerUserToAccept 将直接提示队伍满,不能提交任务

以上总结以dfs 及mine帐户在 static-1.space|app-25.space作测试得出的结论

相应的代码见 CapacitySchedulerQueue checkJobSubmissionLimits ()方法

int queueWaitingJobs = getNumWaitingJobs();

int queueInitializingJobs = getNumInitializingJobs();

int queueRunningJobs = getNumRunningJobs();

if ((queueWaitingJobs + queueInitializingJobs + queueRunningJobs) >= maxJobsToAccept)

{ throw new IOException( "Job '" + job.getJobID() + "' from user '" + user + "' rejected since queue '" + queueName + "' already has " + queueWaitingJobs + " waiting jobs, " + queueInitializingJobs + " initializing jobs and " + queueRunningJobs + " running jobs - Exceeds limit of " + maxJobsToAccept + " jobs to accept"); } // Across all jobs of the user

int userWaitingJobs = getNumWaitingJobsByUser(user);

int userInitializingJobs = getNumInitializingJobsByUser(user);

int userRunningJobs = getNumRunningJobsByUser(user);

if ((userWaitingJobs + userInitializingJobs + userRunningJobs) >= maxJobsPerUserToAccept)

{ throw new IOException( "Job '" + job.getJobID() + "' rejected since user '" + user + "' already has " + userWaitingJobs + " waiting jobs, " + userInitializingJobs + " initializing jobs and " + userRunningJobs + " running jobs - " + " Exceeds limit of " + maxJobsPerUserToAccept + " jobs to accept" + " in queue '" + queueName + "' per user"); }

最终的总结

Queue Name State Scheduling Information
default running Queue configuration
Capacity Percentage: 85.0%
User Limit: 100%
Priority Supported: NO
-------------
Map tasks
Capacity: 17 slots
Used capacity: 0 (0.0% of Capacity)
Running tasks: 0
-------------
Reduce tasks
Capacity: 17 slots
Used capacity: 0 (0.0% of Capacity)
Running tasks: 0
-------------
Job info
Number of Waiting Jobs: 0
Number of Initializing Jobs: 0
Number of users who have submitted jobs: 0
secondqueue running Queue configuration
Capacity Percentage: 15.0%
User Limit: 25%
Priority Supported: YES
-------------
Map tasks
Capacity: 3 slots
Used capacity: 0 (0.0% of Capacity)
Running tasks: 0
-------------
Reduce tasks
Capacity: 3 slots
Used capacity: 0 (0.0% of Capacity)
Running tasks: 0
-------------
Job info
Number of Waiting Jobs: 0
Number of Initializing Jobs: 0
Number of users who have submitted jobs: 0

capacity-scheduler在多用户任务并行运行环境下,通过对现有集群的slots进行按queue 比率来进行划分
进而达到队列内不同用户的比率控制,
相比hadoop 默认的JobQueueTaskScheduler 单一队列fifo,传统无特点的调度算法是一个极大的改进,推荐使用

Hadoop调度算法CapacityScheduler源码分析：http://blog.csdn/zhoujq/article/details/6737441

本文标签： Hadoop Capacity scheduler

版权声明：本文标题：hadoop Capacity Scheduler解析内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1728621846a1166454.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

hadoop Capacity Scheduler解析

更多相关文章

C++中string的Reserve() 和 capacity()

conflict miss 和 capacity miss

Java-002-StringBuffer中的capacity的扩增机制

Java字符容量capacity()方法

vector中的size和capacity

STL中vector的capacity、size、reserve、resize

hadoop2.3.0错误之Configured Capacity: 0 (0 B)Present Capacity: 0 (0 B) DFS Remaining: 0 (0 B) DFS Used:

STL中的capacity和size

容器的capacity、max_size以及内存分配

ByteBuffer的position、limit和capacity

StringBuffer setLength 和 append对capacity的影响

hadoop 0.23的容量调度器简介（Hadoop MapReduce Next Generation - Capacity Scheduler）

StringBuilder对象Capacity属性

flume报错 Configured capacity is 100000000 but thecheckpoint file capacity is 1000000

Hadoop Capacity Scheduler配置使用记录

C++顺序容器的capacity和reserve方法

vector的reserve（），resize（），capacity（）

C++中string的size,length,capacity三者到底有何区别求解啦?

Hadoop 2.0中Capacity Scheduler与Fair Scheduler对比

StringBuffer中length()和capacity()的区别用法

发表评论

推荐文章

office2007每次打开都配置进度_office2007 每次打开word,excel等显示正在配置Office Professional Plus 2007的解决方...

架构师修炼系列【微服务】

猫头虎分享：9个实用的GPT-4o提示词

前端——html定位position用法(相对位置问题)

StringBuilder的Capacity属性

热门文章

勒索病毒现状和防御勒索病毒最佳实践（云端和线下个人电脑，服务器都可部署）

win10锁定计算机会断网吗,Win10专业版如何设置锁屏后不断网？超详细的图文教程...

Java岗大厂面试百日冲刺【Day50】— 秒杀系统2 （日积月累，每日三题）

移动端h5项目的兼容和适配问题

win7安装tensorflow-gpu版(Anaconda)

A Matter of Interpretation

贝叶斯方法（Bayesian approach） —— 一种概率解释（probabilistic interpretation）

vector中capacity()和size()有什么不同？

java.lang.IllegalStateException: Current state = FLUSHED, new state = CODING_END问题查找

Minimum supported Gradle version is 4.1. Current version is 2.14.1.

最新文章

windows计算机查看里设置,windows10电脑配置怎么查看

js判断电脑是windows系统还是mac系统(干货满满哦)

设置计算机系统语言,windows系统默认语言如何设置-windows系统默认语言设置方法 - 河东软件园...

w ndows10摄像头设置,windows10系统电脑摄像头怎么打开

怎么提高计算机的桌面性能,Win7系统十大优化技巧让你的电脑一快再快

Windows完全更换ubuntu系统

问题：windows日志系统事件36887造成电脑蓝屏重启

苹果电脑装双系统利弊有哪些

(详细)Windows10系统自动修复方法

Windows 11系统如何将“此电脑”显示在桌面？

如何查看自己windows电脑的IP地址

清除计算机用户缓存,如何在Windows 7中清除内存缓存，释放电脑空间？

windows7到底是多用户多任务操作系统还是单用户多任务操作系统

windows系统查看电脑里面所有应用软件方法步骤

电脑、Windows系统下方搜索栏搜不出文件怎么办？如何解决？实测有效

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载