spark异常:Consider boosting spark.yarn.executor.memoryOverhead

编程知识 更新时间:2023-05-02 05:23:37

记录spark异常

1. spark内存溢出:数据倾斜问题

Container killed by YARN for exceeding memory limits…
Consider boosting spark.yarn.executor.memoryOverhead

内存溢出,百度了好多,都说调整这个那个参数,都未成功。

后发现是数据倾斜问题造成(某一个task执行特别慢的时候,关注一下条数)

解决:根据提示代码1040行定位到原因,某个rdd groupBy的key全为空,导致数据倾斜

2. Stage cancelled because SparkContext was shut down

小数据量8千万跑的时候没问题,3亿条一起跑,通过聚合join之类的操作 出现这个异常,后发现是reparation设置太大了,设置了15000

解决:reparation设置的8000然后就没问题了,这个值需要根据数据量及大小预估,3亿条数据约300G左右,相当于一个partition有40M

更多推荐

spark异常:Consider boosting spark.yarn.executor.memoryOverhead

本文发布于:2023-04-26 05:53:00,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/166f807f2c813e8df76b3ae7d52a47fa.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:异常   boosting   spark   memoryOverhead   executor

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!

  • 104354文章数
  • 26212阅读数
  • 0评论数