spark任务优先级设置：spark.yarn.priority|电子爱好者

admin管理员组
文章数量:1623795

Spark对于Yarn priority的支持源码详解

Yarn的调度器

在Yarn中，提供了Capacity scheduler和Fair scheduler，它们都支持priority的。这里我们简单介绍下概念，不做过多的描述。

Capacity Scheduler

Capacity scheuler设计的目的是为了让Hadoop上的applications可以以一个多租户的形式下分享资源运行，这种调度器一般应用在有一个较大的公有集群，按照队列来分配资源给特定的用户组。我们可以简单的通过配置就可以设定队列在cluster中资源或者用户在队列中的的使用限制（最低保障和最高上限等），当一个队列的资源空余的时候，Yarn可以暂时利用剩余的资源分享给其他需要的队列。

Fair Scheduler

Fair scheduler就如同它的名字一样，他在分配资源的时候，是秉承着公平原则，applications在一段时间内分配到的平均资源会趋于相等。如果一个只有一个application在集群上运行的时候，资源都可供这一个application使用。如果有另外的application被提交到集群上时，空闲的资源就会被分配给新提交的application上，这样最后每个运行的application都会分配到相等的资源。

Priority在Yarn中的使用

Capacity Scheduler

Capacity scheduler支持对应用的priority的设置。Yarn的priority是整数型，更大的数就代表更高的优先级，这个功能只支持在FIFO（默认）的策略下进行。priority可以针对cluster或者queue级别进行设置。

cluster level: 如果你的application设置的priority超过了cluster最大值，那按照最大的cluster priority对待。
queue level: 队列有一个默认的priority值，queue下的applications如果没有设置具体的priority会被设置成该默认值。如果application变更了queue，它的priority值不会更改。

Fair Scheduler

Fair scheduler支持把一个正在运行的application迁移到另一个priority不同的queue里，这样这个application获取资源的权重就会跟着queue变化。被迁移得application的资源就会算在新的queue上，如果所需资源超过了新的queue的最大限制，迁移就会失败。

SparkOnYarn支持priority

如何为Spark app设置priority

只需要再SparkConf里进行设置即可，遵循Yarn对于priority的定义，数值越大，priority越高，在同一时间提交的job会有更高的优先级获取资源：

val sparkConf = new SparkConf()
      .set(APPLICATION_TAGS.key, ",tag1, dup,tag2 , ,multi word , dup")
      .set(MAX_APP_ATTEMPTS, 42)
      .set("spark.app.name", "foo-test-app")
      .set(QUEUE_NAME, "staging-queue")
      .set(APPLICATION_PRIORITY, 1)

Spark源码

Spark目前已经有了对于Yarn的priority官方支持，这里给出一个在Jira上closed的SPARK-10879。这个Jira是很早以前的一个版本，diff仅供参考，用于让大家理解Spark on Yarn如何设置priority的基本流程。
其实需要支持priority很简单，一是需要在submit的时候提供priority参数的设置,官方是放在了SparkConf里去设置；另一个是需要在createApplicationSubmissionContext的时候，调用setPriority将priority传入到Yarn。这里给出关键的地方的代码：

/resource-managers/yarn/src/main/scala/org/apache/spark/deploy/yarn/config.scala

  private[spark] val APPLICATION_PRIORITY = ConfigBuilder("spark.yarn.priority")
    .doc("Application priority for YARN to define pending applications ordering policy, those" +
      " with higher value have a better opportunity to be activated. Currently, YARN only" +
      " supports application priority when using FIFO ordering policy.")
    .intConf
    .createOptional

/resource-managers/yarn/src/main/scala/org/apache/spark/deploy/yarn/Client.scala中对createApplicationSubmissionContext函数的修改：

/**
   * Set up the context for submitting our ApplicationMaster.
   * This uses the YarnClientApplication not available in the Yarn alpha API.
   */
  def createApplicationSubmissionContext(
      newApp: YarnClientApplication,
      containerContext: ContainerLaunchContext): ApplicationSubmissionContext = {

    val componentName = if (isClusterMode) {
      config.YARN_DRIVER_RESOURCE_TYPES_PREFIX
    } else {
      config.YARN_AM_RESOURCE_TYPES_PREFIX
    }
    val yarnAMResources = getYarnResourcesAndAmounts(sparkConf, componentName)
    val amResources = yarnAMResources ++
      getYarnResourcesFromSparkResources(SPARK_DRIVER_PREFIX, sparkConf)
    logDebug(s"AM resources: $amResources")
    val appContext = newApp.getApplicationSubmissionContext
    appContext.setApplicationName(sparkConf.get("spark.app.name", "Spark"))
    appContext.setQueue(sparkConf.get(QUEUE_NAME))
    appContext.setAMContainerSpec(containerContext)
    appContext.setApplicationType("SPARK")

    sparkConf.get(APPLICATION_TAGS).foreach { tags =>
      appContext.setApplicationTags(new java.util.HashSet[String](tags.asJava))
    }
    sparkConf.get(MAX_APP_ATTEMPTS) match {
      case Some(v) => appContext.setMaxAppAttempts(v)
      case None => logDebug(s"${MAX_APP_ATTEMPTS.key} is not set. " +
          "Cluster's default value will be used.")
    }

    sparkConf.get(AM_ATTEMPT_FAILURE_VALIDITY_INTERVAL_MS).foreach { interval =>
      appContext.setAttemptFailuresValidityInterval(interval)
    }

    val capability = Records.newRecord(classOf[Resource])
    capability.setMemory(amMemory + amMemoryOverhead)
    capability.setVirtualCores(amCores)
    if (amResources.nonEmpty) {
      ResourceRequestHelper.setResourceRequests(amResources, capability)
    }
    logDebug(s"Created resource capability for AM request: $capability")

    sparkConf.get(AM_NODE_LABEL_EXPRESSION) match {
      case Some(expr) =>
        val amRequest = Records.newRecord(classOf[ResourceRequest])
        amRequest.setResourceName(ResourceRequest.ANY)
        amRequest.setPriority(Priority.newInstance(0))
        amRequest.setCapability(capability)
        amRequest.setNumContainers(1)
        amRequest.setNodeLabelExpression(expr)
        appContext.setAMContainerResourceRequest(amRequest)
      case None =>
        appContext.setResource(capability)
    }

    sparkConf.get(ROLLED_LOG_INCLUDE_PATTERN).foreach { includePattern =>
      try {
        val logAggregationContext = Records.newRecord(classOf[LogAggregationContext])
        logAggregationContext.setRolledLogsIncludePattern(includePattern)
        sparkConf.get(ROLLED_LOG_EXCLUDE_PATTERN).foreach { excludePattern =>
          logAggregationContext.setRolledLogsExcludePattern(excludePattern)
        }
        appContext.setLogAggregationContext(logAggregationContext)
      } catch {
        case NonFatal(e) =>
          logWarning(s"Ignoring ${ROLLED_LOG_INCLUDE_PATTERN.key} because the version of YARN " +
            "does not support it", e)
      }
    }
    appContext.setUnmanagedAM(isClientUnmanagedAMEnabled)

    sparkConf.get(APPLICATION_PRIORITY).foreach { appPriority =>
      appContext.setPriority(Priority.newInstance(appPriority))
    }
    appContext
  }

本文标签：优先级 Spark Priority yarn

版权声明：本文标题：spark任务优先级设置：spark.yarn.priority 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1728895485a1178353.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

spark任务优先级设置：spark.yarn.priority

Spark对于Yarn priority的支持源码详解

Yarn的调度器

Capacity Scheduler

Fair Scheduler

Priority在Yarn中的使用

Capacity Scheduler

Fair Scheduler

SparkOnYarn支持priority

如何为Spark app设置priority

Spark源码

更多相关文章

C++ std::优先级队列priority_queue

priority的用法

WebRTC系列-网络传输之7-ICE补充之偏好(preference)与优先级(priority)

priority-queue outmls qos trust dscp在cisco9300接口下怎么配置

java多线程-- thread.setPriority() 线程优先级

Hadoop安装错误：Cannot set priority of secondarynamenode process : xxxxx

R语言安装报错：Package LibPath Version Priority Depends Imports LinkingTo Suggests Enhances License Li

【已解决】 Invalid configuration value: failovermethod=priority in etcyum.repos.dCentOS-Linux-BaseOS

C++中priority_queue优先级队列的初始化

(解决)Key already registered with the same priority: GroupSpatialSoftmax

hadoop开启时报错：Cannot set priority of namenode process 3323

CortexM4内核Stm32-HAL_Init()及HAL_InitTick(TICK_INT_PRIORITY()详解——Systick中断优先级

c语言中如何编写优先级的代码,优先队列(priority_queue)的C语言实现代码

优先级队列（priority_queue）基础知识点

C++STL中的set、map和priority_queue默认优先级（升降序）备忘录

android:priority

《 C++ 修炼全景指南：七 》优先级队列在行动：解密 C++ priority_queue 的实现与应用

Thread的setPriority()设置优先级源代码分析(5)

init_priority (priority)

SUPERMICRO SuperServer 7048GR-TR - VGA Priority 设置 [Offboard]

发表评论

推荐文章

罗技方向盘SDK开发笔记

OCR - 微软windows 11系统自带的Windows OCR功能初体验

关于新版微软输入法在windows11操作系统下，无法正常显示输入法中候选字词栏(candidate list)

STM32 NVIC_SetPriority详解

苹果应用商店登陆服务器出现问题,苹果应用商店提示无法登录的问题

热门文章

12f的接线 esp8266_Arduino连接ESP8266串口WIFI超详细入门教程

X度网盘大文件使用浏览器或迅雷下载的方法之一

记录打包GoogleChrome浏览器插件

Mac adobe PS、AI、PR、AN安装包

WiFi认证是如何保证企业WiFi的安全？

一文看全！史上以来的59家测序仪公司

INTRODUCTION TO THE LAW OF VIRTUAL AND AUGMENTED REALITY

优先级队列priority_queue的介绍与使用

STL之优先队列priority_queue（C++）

RabbitMQ学习笔记：消息优先级（priority）

最新文章

解决常见Surface上不了应用商店的问题

Chrome扩展程序应用商店方式一

应用市场显示服务器错误的是,win10应用商店打不开服务器出错怎么办

win10企业版如何安装应用商店-默认没有应用商店

windows10 LTSC版本 安装应用商店及聚焦屏保

2021 App上架到 各应用商店（应用宝，华为，vivo，小米，AppStore）

Chrome应用商店打不开问题

Chrome浏览器应用商店扩展插件无法安装的解决办法

rancher应用商店的使用

Flutter：使用url_launcher打开外部浏览器、拨打电话、发送短信、打开第三方app、打开应用商店下载应用

[云原生专题-53]：Kubesphere云治理-操作-通过Kubesphere应用商店一键部署微服务应用-消息中间件RabbitMQ的安装与部署

deepin-appstore 编译及下载的应用无法改变路径说明

如何找到 Microsoft Store 下载的python文件位置

kubesphere发布应用到应用商店完整步骤

play商店 小米_小米应用商店和Google Play商店的简单对比

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

《 C++ 修炼全景指南：七》优先级队列在行动：解密 C++ priority_queue 的实现与应用

windows10 LTSC版本安装应用商店及聚焦屏保

2021 App上架到各应用商店（应用宝，华为，vivo，小米，AppStore）

play商店小米_小米应用商店和Google Play商店的简单对比

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载