Flink重启策略Restart-Strategy|电子爱好者

admin管理员组
文章数量:1580424

Flink重启策略

为什么需要设置重启策略？

当任务失败时，Flink需要重新启动失败的任务和其他受影响的任务，以将作业恢复到正常状态。

重新启动策略和故障转移策略用于控制任务重新启动。重新启动策略决定是否以及何时可以重新启动失败/受影响的任务。故障转移策略决定应重新启动哪些任务以恢复作业。

NOTE：重启策略需要配合Checkpoint启动，因为需要用到flink的内部State

使用RestartStrategy

配置文件配置

配置文件中是DataSet&DataStream通用的。

如果enableCheckpoint()没有设置，那么restart-strategy默认为:none

如果设置了enableCheckpoint()，那么restart-strategy为：fixed-delay且delay=1s

#这里有3种不同的重启策略，
restart-strategy: none, off, disable|fixeddelay, fixed-delay|failurerate, failure-rate

通过ExecutionConfig配置

//限定重启次数
val env = StreamExecutionEnvironment.getExecutionEnvironment
  env.setRestartStrategy(
	RestartStrategies.fixedDelayRestart(
  3, // 尝试重启的次数
  Time.of(10, TimeUnit.SECONDS) // 每次重启之间的时间间隔，即重启尝试时间
)
  
//限定失败率
  //如果Duration被设为5分钟 = 300s，那么10s尝试重启一次，那么实际可重试30次
  //failure-rate = n/30 其中n为重试但失败的次数，如果达到一定的阈值，那么任务重启失败
val env = ExecutionEnvironment.getExecutionEnvironment()
env.setRestartStrategy(RestartStrategies.failureRateRestart(
  3, // 5min内允许失败的最大次数，可以适当调整
  Time.of(5, TimeUnit.MINUTES), //用来衡量失败率的时间间隔
  Time.of(10, TimeUnit.SECONDS) //2个连续的重试尝试之间的时间间隔
))

重启策略 Restart strategy

fixed-delay

#假如 restart-strategy: fixed-delay
restart-strategy.fixed-delay.attempts=3 [default]
restart-strategy.fixed-delay.delay=2s [default]

举个栗子：
===> 假如 delay=1s,attempts=1,那么重启的策略就为每2秒尝试重启一次，要么重启成功，要么失败进入下一次重启尝试，如果累计重试次数达到3次但是任然没有成功，那么这个task重启就算失败

failure-rate

restart-strategy.failure-rate.max-failures-per-interval: 3  
restart-strategy.failure-rate.failure-rate-interval: 5 min
restart-strategy.failure-rate.delay: 10 s

举个栗子：
===> 假如failure-rate-interval=5min，max-failures-per-interval=3，delay=10，那么重启策略就是每10s尝试重启一次，如果连续重试失败次数超过3次，那么表示重启失败

non-restart

不启用重启策略

fallback-restart

Flink自动管理重启策略，如果用这个策略，那么默认就是使用fixed-dalay

失败策略Failover strategy

官网参考：https://ci.apache/projects/flink/flink-docs-release-1.10/dev/task_failure_recovery.html

可以通过flink-conf.yaml来设置failover strategy

Restart All Failover Strategy

这个策略是重启整个job中所有的task，从失败恢复到正常状态

Restart Pipelined Region Failover Strateg

用来决定在region 失败策略中的region范围，这种策略比重启所有任务代价要小的多env.getConfig.setExecutionMode(ExecutionMode.PIPELINED)

jobmanager.execution.failover-strategy	value to config
Restart all 重启所有的任务	Full
Restart pipelined region 重启单个分区内的任务	Region

简单的实践Checkpoint代码

package com.shufang.state.chekpoint

import com.shufang.broadcast.People
import com.shufang.entities.WorkPeople
import com.shufang.source.MyUDFPeopleSource
import org.apache.flink.api.common.ExecutionMode
import org.apache.flink.api.common.restartstrategy.RestartStrategies
import org.apache.flink.api.common.state.MapStateDescriptor
import org.apache.flink.api.common.time.Time
import org.apache.flink.api.common.typeinfo.TypeInformation
import org.apache.flink.runtime.executiongraph.restart.RestartStrategy
import org.apache.flink.streaming.api.CheckpointingMode
import org.apache.flink.streaming.api.datastream.BroadcastStream
import org.apache.flink.streaming.api.environment.CheckpointConfig
import org.apache.flink.streaming.api.functions.co.{BroadcastProcessFunction, KeyedBroadcastProcessFunction}
import org.apache.flink.streaming.api.scala._
import org.apache.flink.util.Collector

object CheckPointDemo {

  def main(args: Array[String]): Unit = {

    //获取执行环境
    val env: StreamExecutionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment

    //用来决定在region (failover strategy)失败策略中的region范围
    env.getConfig.setExecutionMode(ExecutionMode.PIPELINED)
    /**
     * --------------------------------------checkpoint的配置-----------------------------------------------
     */
    env.enableCheckpointing(1000) //每1s checkpoint 一次
    env.getCheckpointConfig.setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE) //默认是EXACTLY_ONCE
    env.getCheckpointConfig.setCheckpointInterval(1000) //每隔 1s进行一次checkpoint 的工作
    env.getCheckpointConfig.setCheckpointTimeout(6000) //如果checkpoint操作在6s之内没有完成，那么就discard终端该checkpoint操作
    //true：假如在checkpoint过程中产生了Error，那么Task直接显示失败
    //false：产生了error，Task继续运行，checkpoint会降级到之前那个状态
    env.getCheckpointConfig.setFailOnCheckpointingErrors(false) //默认为true
    env.getCheckpointConfig.setMaxConcurrentCheckpoints(1) //在统一时间只能同时有1个checkpoint操作，其他的操作必须等当前操作执行完或者超时之后才能执行
    env.getCheckpointConfig.enableExternalizedCheckpoints(CheckpointConfig.ExternalizedCheckpointCleanup.DELETE_ON_CANCELLATION) //清除或保留状态
    env.getCheckpointConfig.setMinPauseBetweenCheckpoints(0) //下一个checkpoint操作触发之前最小的阻塞时间，必须>=0


    /** --------------------------------------配置重启策略----------------------------------------------------
     * When a task failure happens, (当一个任务失败后)
     * Flink needs to restart the failed task and other affected tasks to recover the job to a normal state.
     * （Flink 需要重启失败的任务和其他受影响的task并恢复到一个正常的状态）
     * 重启配置与checkpoint设置有关：
     * 如果没有开启checkpoint，那么重启策略为：no restart！
     * 如果开启了checkpoint，那么重启策略默认为：fixed-delay strategy is used with Integer.MAX_VALUE
     *
     * restart-strategy 可以在flink-conf.yaml中进行设置，也可以通过env.setRestartStrategy（）设置
     */


    /*env.setRestartStrategy(
      RestartStrategies.failureRateRestart(
        10,
        Time.minutes(5),
        Time.seconds(10))
    )*/

    //env.setRestartStrategy(new RestartStrategies.FallbackRestartStrategyConfiguration) //自动按照fixed-dalay重启策略

    /*env.setRestartStrategy(
      new RestartStrategies.FailureRateRestartStrategyConfiguration(
      10,
      Time.minutes(5),
      Time.seconds(10)))*/

    //env.setRestartStrategy(new RestartStrategies.NoRestartStrategyConfiguration())

    //env.setRestartStrategy(new RestartStrategies.FixedDelayRestartStrategyConfiguration(5,Time.seconds(4)))

    //env.setRestartStrategy(RestartStrategies.fixedDelayRestart(5,Time.seconds(4)))

    val config = new RestartStrategies.FailureRateRestartStrategyConfiguration(3, Time.minutes(5), Time.seconds(10))
    env.setRestartStrategy(config)

    val ds: DataStream[WorkPeople] = env.addSource(new MyUDFPeopleSource)

    val ds1: DataStream[(Int, Char)] = env.fromElements((1, '男'), (2, '女'))

    val describer = new MapStateDescriptor[Int, Char]("genderInfo", classOf[Int], classOf[Char])

    val bcStream: BroadcastStream[(Int, Char)] = ds1.broadcast(describer)

    val resultStream: DataStream[People] = ds.connect(bcStream).process(
      new BroadcastProcessFunction[WorkPeople, (Int, Char), People] {
        override def processElement(value: WorkPeople,
                                    ctx: BroadcastProcessFunction[WorkPeople, (Int, Char), People]#ReadOnlyContext,
                                    out: Collector[People]): Unit = {
          val gender: Char = ctx.getBroadcastState(describer).get(value.genderCode).charValue()
          out.collect(People(value.id, value.name, gender, value.address, value.price))
        }

        override def processBroadcastElement(value: (Int, Char), ctx: BroadcastProcessFunction[WorkPeople, (Int, Char), People]#Context, out: Collector[People]): Unit = {
          ctx.getBroadcastState(describer).put(value._1, value._2)

        }
      }
    )


    ds.print("before:")
    resultStream.print("after:")


    env.execute("checkpoint")
  }
}

本文标签：重启策略 Flink restart Strategy

版权声明：本文标题：Flink重启策略Restart-Strategy 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1725699924a1037343.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

Win10 拖动文件从文件夹里复制到桌面时出现黑屏资源管理器重启复制失败

3天前

环境： Win10 专业版联想E14笔记本问题描述： 在文件移动复制时，从文件夹拖拽复制到桌面时，会卡顿，电脑黑屏闪一

虚拟机启动电脑就重启是怎么回事？

3天前

问题如下： 虚拟机启动电脑就重启，如果你的VM是Pro15版本及一下的画基本上就是版本不兼容的问题。解决办法就是重新安装VMPro16及以上的版本。（亲测有用&#xf

Centos7.4重启网络失败（虚拟机无法连接互联网）Job for network.service failed

2天前

本篇博客主要是记录在使用VMware安装Centos7.4时，虚拟机无法连接互联网问题（重启网络指令执行失败重启成功但无法ping通外网）。启动网络服务时提示 Job

Flink Web UI不能访问

2天前

1. 简单介绍由于项目需要用到Flink，做测试时将flink在服务器解压缩完毕后，直接.binstart-cluster.sh启动Flink程序，正常启动后无法通过

ubuntu系统如何解决电脑重启后不能自动连接wifi的问题

1天前

实际的项目过程中，发现系统重启后不能自动连接wifi，导致不能远程连接远程桌面，实在是造成了很大的麻烦，下面是解决方法：eleven@eleven-OptiPlex-7040:~$ cd

Winning with Software: An Executive Strategy

1天前

华为er路由器设置虚拟服务器,华为AR111-S路由器双线路策略路由配置笔记

1天前

本帖最后由 taxigps 于 2021-3-17 11:52 编辑一、应用场景家里安装了电信500M和移动500M的双宽带，之前用R7000刷改版固件来支持双线接入。因手机、电脑等无线接入设备均更新为支持WIFI6的型号，需要相应更换

重启电脑后爱奇艺仍提示缺少DLL文件？轻松几步恢复畅享！

1天前

在享受爱奇艺海量影视资源的过程中，偶尔会遇到因系统文件缺失导致的播放障碍，比如弹出“缺少DLL文件”的错误提示。这可能是由于系统更新、软件冲突或不当操作所致，但无需过分担忧&

随身WiFi板子uz801v3.0切卡重启不刷机解决方案

1天前

昨天看群里很多萌新问苏宁801自动重启怎么解决，让进9008刷机得从开adb教到miflash按哪个键，很显然，对于一开始就想输密码切卡直接用的新手而言&#xff0c

电脑定时关机重启！制作方便你控制电脑关机，重启时间的BAT文件。

22小时前

有时候，可能电脑要晚点才关机。而你却要早睡啦。这时候就需要一个定时关机命令！ a取消之前的注销命令.bat ：shutdown a 一个小时后关机.bat &#x

19、Flink 的Table API 和 SQL 中的自定义函数及示例（2）

20小时前

Flink 系列文章一、Flink 专栏 Flink 专栏系统介绍某一知识点，并辅以具体的示例进行说明。 1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分

不修改注册表解决win10系统每次重启桌面图标排列混乱的问题

16小时前

鼠标右键点击个性化>>主题找到桌面图标设置把计算机回收站用户的文件控制面板网络等前面框复选框全部勾选掉，然后在桌面新建文件夹把桌面所有的图标剪切到新建文件里面，然后把新建文件夹

关于php-fpm中的两项参数emergency_restart_thresholdinterval及重启php-fpm时请求发生502错误解决：process_control_timeout

15小时前

一、关于php-fpm中的两项参数emergency_restart_thresholdinterval php-fpm默认安装后以下三个参数都是关闭的： #表示在emergency_restart_interv

【Linux】重启后进入了紧急模式&应急模式（emergency mode）

15小时前

本章进行测试复现问题将etcfstab挂载home参数defaults写错一般在编辑etcfstab后都会去执行mount -a 这里可以看到执行后并未出现错误那么咱们重启测试一下可以看到如图所示出现的错误信息解

电脑蓝屏崩溃，重启VM虚拟机出现Generating runinitramfsrdsosreport .txt Entering emergency mode. 问题

15小时前

问题如此首先 （centos） ls devmapper 我们这里是centos-root 然后输入 xfs_repair devmappercentos-root -L

重启后出现：“welcome to emergency mode，give root password..

15小时前

重启后出现：“welcome to emergency mode！… give root password for maintenance”，可能是设置的自动挂载&#

Linux自动挂载硬盘重启后进入Emergency mode 输入密码无法大写锁定的问题解决办法

15小时前

Linux自动挂载硬盘重启后进入Emergency mode 输入密码无法大写锁定的问题解决办法前言： 新手小白在学习使用Linux 测试SSD，然后尝试自动挂载硬盘。在参考其他博客&

win10计算机策略配置文件,Win10家庭版编辑组策略设置更改组策略方法

14小时前

Windows 10家庭用户也可以使用免费的替代工具称为政策加更改组策略设置。政策上是一个独立的工具，允许你改变在任何版本的Windows组策略设置，包括Windows 10家庭。通常&

win10 没有计算机策略,Win10家庭版没有组策略怎么办？Win10家庭版打开组策略方法...

14小时前

Win10主要分为专业版、家庭版和企业版三个版本，其中大多数普通用户用的基本是专业版或家庭版。其中Win10家庭版中并不包含组策略，这意味着对于使用家庭版用户来说，无法借助组

U盘打开提示要格式化：深度剖析、恢复策略与预防指南

12小时前

U盘打开提示要格式化现象阐述在日常的数字生活中，U盘作为便携式存储设备的代表，扮演着不可或缺的角色。然而，不少用户都曾遭遇过这样一个令人头疼的问题：

电子爱好者 - 最新技术资讯及电子产品介绍！

Flink重启策略Restart-Strategy

Flink重启策略

使用RestartStrategy

配置文件配置

通过ExecutionConfig配置

重启策略 Restart strategy

fixed-delay

failure-rate

non-restart

fallback-restart

失败策略Failover strategy

Restart All Failover Strategy

Restart Pipelined Region Failover Strateg

简单的实践Checkpoint代码

更多相关文章

Win10 拖动文件从文件夹里复制到桌面时出现黑屏资源管理器重启复制失败

虚拟机启动电脑就重启是怎么回事？

Centos7.4重启网络失败（虚拟机无法连接互联网）Job for network.service failed

Flink Web UI不能访问

ubuntu系统如何解决电脑重启后不能自动连接wifi的问题

Winning with Software: An Executive Strategy

华为er路由器设置虚拟服务器,华为AR111-S路由器双线路策略路由配置笔记

重启电脑后爱奇艺仍提示缺少DLL文件？轻松几步恢复畅享！

随身WiFi板子uz801v3.0切卡重启不刷机解决方案

电脑定时关机 重启！制作方便你控制电脑关机，重启时间的BAT文件。

19、Flink 的Table API 和 SQL 中的自定义函数及示例（2）

不修改注册表解决win10系统每次重启桌面图标排列混乱的问题

关于php-fpm中的两项参数emergency_restart_thresholdinterval及重启php-fpm时请求发生502错误解决：process_control_timeout

【Linux】重启后进入了紧急模式&amp;应急模式（emergency mode）

电脑蓝屏崩溃，重启VM虚拟机出现Generating runinitramfsrdsosreport .txt Entering emergency mode. 问题

重启后出现：“welcome to emergency mode，give root password..

Linux自动挂载硬盘重启后进入Emergency mode 输入密码无法大写锁定的问题解决办法

win10计算机策略配置文件,Win10家庭版编辑组策略设置更改组策略方法

win10 没有计算机策略,Win10家庭版没有组策略怎么办？Win10家庭版打开组策略方法...

U盘打开提示要格式化：深度剖析、恢复策略与预防指南

发表评论

推荐文章

解决WIN10系统电脑右下角网络图标不见&amp;网络无法连接的方法总结（2021.1030）

（转）Entering emergency mode. Exit the shell to continue.

爱普生相机SD卡格式化后数据恢复指南

signature=48af92c80b14d6f07db6ad0b6715c38e,Audience measurement system utilizing ancillary codes and...

金九银十求职高峰期，企业高频面试题和答案都帮你准备好啦

热门文章

最近频繁出现的Win1011 网络断连，无网络原因及解决方法

Ubuntu 19 忘记登陆密码重设密码

Cisco路由器忘记密码

cisco 路由器密码的恢复及配置的删除

windows平台使用CMake工具对darknet的编译以及安装过程+yolov3+图像检测+摄像头检测+视频检测+手机作为摄像头进行检测（详解）

CS402_Zhu_Yetuo_HW1

android开发规范阿里，Android外包是如何进入阿里的

python宿舍管理系統毕业设计源码231642

【Boot failure on device】问题解决

隔壁公司因业务开了一堆AP，严重干扰我们该怎么办？

最新文章

63、推理 是万能大法，ywz网络无法上外网

黑客讲故事：攻下隔壁女生路由器后，我都做了些什么【转】

Android WiFi功能实现，知其然必知其所以然！ （二）

OpenHarmony学习笔记——网络通信

如何使用Reaver破解Wi-Fi网络的WPA密码

树莓派设置wifi

渗透&amp;&amp;探测 (如何断开隔壁妹纸的无线网络)

网友称WIFI存安全漏洞 5分钟可控制用户

渗透测试资源大合集

上了这套密码锁，你就无敌了

转发：黑客说:我攻击了隔壁女神的路由器,然后

来感受一下别人的密码，名字缩写什么的都弱爆了！

苹果蓝牙连接不上是什么原因_无线网连接不上 原因很多，总有一个办法解决你的问题...

【爬虫实战】同学利用Python拥有了全部的人物皮肤，隔壁班的同学们都馋哭了~(源码分享)

5G时代即将到来，有线网络WiFi会消失不见吗？

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

电脑定时关机重启！制作方便你控制电脑关机，重启时间的BAT文件。

【Linux】重启后进入了紧急模式&应急模式（emergency mode）

解决WIN10系统电脑右下角网络图标不见&网络无法连接的方法总结（2021.1030）

63、推理是万能大法，ywz网络无法上外网

Android WiFi功能实现，知其然必知其所以然！（二）

渗透&&探测 (如何断开隔壁妹纸的无线网络)

苹果蓝牙连接不上是什么原因_无线网连接不上原因很多，总有一个办法解决你的问题...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载