admin管理员组

文章数量:1618715

Spark任务:Job aborted due to stage failure: Task 0 in stage 2.0 failed 4 times, most recent failure问题

跑Spark任务时报错,复制任务id(application_1111_222)到yarn页面中检索,发现报以下错误:
Job aborted due to stage failure: Task 0 in stage 2.0 failed 4 times, most recent failure

使用sc读取集群某路径下的日志,并且按照分隔符切分"\t",split("/t",-1),产生了数组下标越界,原因是在切分时并不能保证每一条的日志都是正常

#解决方案:

所以需要使用try catch 来处理异常即可

本文标签: dueStageabortedSparkjob