一次Spark程序运行缓慢原因排查|电子爱好者

admin管理员组
文章数量:1656763

功能：判断车辆轨迹数据在指定区域内停留时间超过半小时。

实现思路：车辆定位数据生成RDD，遍历RDD每个元素，判断是否在指定区域内，如果在，则累加计算停留时间，最后判断停留时间是否超过半小时。

代码：

sortLocationInfoRDD.foreachPartition(
                    new VoidFunction<Iterator<CarLocationInfo>>() {
                        @Override
                        public void call(Iterator<CarLocationInfo> iterator) throws Exception {
                            Jedis jedis = JedisUtil.getInstance().getJedis(Constants.REDIS_IP, Constants.REDIS_PORT);
                            while (iterator.hasNext()) {
                                CarLocationInfo locationInfo = iterator.next();
                                System.out.println("开始:"+System.currentTimeMillis());
                                //判断定位点是否在指定区域内，然后使用Redis记录停留状态和累计停留时间
                                System.out.println("结束:"+System.currentTimeMillis());
                            }

                            JedisUtil.getInstance().closeJedis(jedis, Constants.REDIS_IP, Constants.REDIS_PORT);

                        }
                    }
            );

问题：采用yarn-client方式运行，查看log发现开始时间和结束时间花费时间达数秒，而使用java程序单独运行区域判别程序，速度很快。也就是出现spark yarn模式运行速度还不如单台电脑。

排查过程：

1.首先是网上查了一下Spark程序运行缓慢、Spark性能调优的方法，更多是一些参数配置性的操作，然并卵。

2.查看spark job，发现程序卡在foreachPartitions。

foreachPartitions中有两部分代码，一部分是判别定位点是否在指定区域内，另一部分是对Redis的操作。

注释掉Redis操作部分代码，执行程序，发现运行速度是正常的，所有最终定位到时对Redis的操作造成了程序运行缓慢，由于所有操作都针对Redis上的一个key-value，所以怀疑是Redis并发操作造成阻塞。

经验证，确实是Redis的并发操作造成阻塞。

如下代码，竟然几分钟都执行不完。

Jedis jedis = new Jedis(Constants.REDIS_IP, Constants.REDIS_PORT);
        System.out.println(System.currentTimeMillis());
        for (int j=0; j<100; j++) {
            for (int i=0; i<7000;i++) {
                jedis.set("key1", "value1");
                jedis.get("key1");
            }
        }
        System.out.println(System.currentTimeMillis());

解决办法：

在foreachPartition下使用内存变量来记录状态，可以达到使用Redis同样的目的。

总结：

注意检查Redis的操作，比如是否关闭Redis连接等，是否存在并发操作Redis的一个值。

本文标签：缓慢原因程序 Spark

版权声明：本文标题：一次Spark程序运行缓慢原因排查内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1729748576a1211929.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

uni-app 开发支付宝百度小程序注意事项及解决

1天前

开发文档支付宝小程序开发文档百度智能小程序开发文档百度小程序已知的差异问题： 不支持属性选择器不支持 scopedlogingetUserInfo 等功能在模拟器（开发工

使用Windows10任务计划程序配置软件开机自启动

20小时前

目录配置过程错误处理配置过程在windows10中找到任务计划程序，点击→新文件夹→新建（检测软件） 点击→创建基本任务输入名称（自定义&a

服务器CPU使用率高的原因分析与解决办法

19小时前

我们的服务器在使用操作系统的时候，用着用着系统就变慢了，打开“ 任务管理器 ”一看,才发现CPU使用率达到80%以上。这是怎么回事情呢？遇到病毒了吗？硬

iOS开发 APP拉起微信小程序Universal Links配置

15小时前

APP中有需要跳转微信小程序的需求，记录一下接入过程步骤一：配置Associated Domains 1.登录苹果开发者中心，找到对应的Identifier勾选 Associated Domains，重新配置下对应的描述文件，在Xcod

新版微信小程序发布指南

15小时前

一.前期准备 1.注册小程序商家需要在微信公众平台官网首页（微信公众平台）点击右上角的“立即注册”按钮，注册一个微信小程序帐号。 2.完善小程序信息注册小程序后&a

小程序学习笔记（不断更新）

15小时前

目录项目结构 app.json文件编辑 project.config.json文件 sitemap.json文件新建页面 wxml模板 wxss样式 app.js文件宿主环境通信主体通信模型运行机制组件

WxJava开发小程序登录、手机号、小程序码、微信支付

8小时前

WxJava开发微信支付、微信登录前言一、引入依赖二、修改配置文件三、小程序微信登录1.登录流程时序2.认识openid、unionid和code3.代码实现四、小程序手机号快速验证1.小程序端2.Java端五、获取小程序二维码1.配

计算机打开程序很卡,教你电脑打开任何程序都慢该如何解决

4小时前

我们的电脑电脑打开任何程序都慢是怎么一回事呢？我们平时打开电脑浏览器，打开我们的QQ音乐都会发现十分的慢，打开半天都不行，这时我们都会变得十分沮丧&am

vmware虚拟机运行速度卡慢原因分析及解决办法大全（一）

4小时前

虚拟机能在现有的系统上虚拟出多个独立的系统，尤其是开发人员测试人员经常会使用，但是大家经常对虚拟机的运行速度不甚满意，甚至经常很恼火。虚拟机速度慢有很多原因&#xff

linux执行命令特别慢,Linux运行速度太慢的关键原因全都在这了

4小时前

原标题：Linux运行速度太慢的关键原因全都在这了我们在搞清楚如何加速Linux计算机之前，需要知道哪些方法可以帮助我们找到引导时启动的服务、以更高或更低优先级运行的进程、CPU运行状况、内存是

计算机启动慢原因,电脑开机慢的原因

4小时前

电脑使用久了难免会出现各种各样的故障，找到故障发生的原因，问题很容易就解决了。按下开机键后电脑没反应， 相信很多用户都曾遇到过这种情况，这是怎么回事呢

vmware虚拟机运行速度卡慢原因分析及解决办法大全

4小时前

转载自品略图书馆 http:www.pinluearticle2020010915369887500707.html 虚拟机能在现有的系统上虚拟出多个独立的系统，尤其是开发人员测试人员经常会使用&

win10系统下，vscode运行Golang程序很慢，好久没有输出结果

4小时前

Golang 运行速度慢的问题解决办法： 解决办法： 关闭杀毒软件 （首先尝试）设置 gopoxy代理： 具体的设置如下&

计算机打开资源管理器特别慢,win10“此电脑”打开慢怎么办-处理win10此电脑打开很缓慢的方法 - 河东软件园...

4小时前

一直以来都有很多的用户向小编抱怨电脑中的资源管理器运行速度太慢，什么是资源管理器呢？其实就是帮助我们保存所有电脑文件的程序，大家都叫它“此电脑或是“计算机”&#xff

【已解决】.py程序一直卡着不动，单步调试也是一直卡着不动该怎么办？

4小时前

问题描述今天遇到这么一个问题：运行程序时候一直卡着不动 python preprocess.py 在服务器上是这样： 在本机电脑上也是这样： 我查看了一下显卡占用情况

Python代码执行慢的原因是什么？如何优化Python代码的性能？

4小时前

1.Python代码执行慢的原因是什么？ Python代码执行慢的原因有很多，以下是其中的一些主要原因： 动态类型：Python 是一种动态类型的语

代码运行如此缓慢的5个原因以及如何修复

3小时前

如果您精心设计的应用程序在部署后运行缓慢，则有五个常见原因，使其在开发计算机上运行良好，但在生产中却完全陷入了困境。当然，还有其他原因导致您的软件在生产中无法正常运行，但这是当开发人员说“它在我的机器上运行良好”然后发现大量生产对软件的

程序莫名卡顿、运行速度大幅降低的一种可能因素

3小时前

前言有一次调试一个程序，在并没有改动什么代码的情况下，突然间程序性能大幅下降，降低了足足75%左右！！一番研究之后&#

如何解决GitHub打开缓慢甚至失败的问题

3小时前

1.原因分析 GitHub 访问缓慢或失败的原因包括以下几点： DNS 污染 GitHub 的 CDN 域名解析可能遭到 DNS 污染，导致无法连接使用 GitHub 的加速分发服务器&#

鸿蒙系统如何添加桌面小程序,微信Windows版更新至3.0：批量管理联系人，小程序可添加至桌面...

2小时前

玩懂手机网资讯，日前，微信的 Windows 版本推送了新版本更新，更新后的版本为「微信 for Windows 3.0.0」，更新后的微信 Windo

电子爱好者 - 最新技术资讯及电子产品介绍！

一次Spark程序运行缓慢原因排查

更多相关文章

uni-app 开发支付宝百度小程序注意事项及解决

使用Windows10任务计划程序配置软件开机自启动

服务器CPU使用率高的原因分析与解决办法

iOS开发 APP拉起微信小程序Universal Links配置

新版微信小程序发布指南

小程序学习笔记（不断更新）

WxJava开发小程序登录、手机号、小程序码、微信支付

计算机打开程序很卡,教你电脑打开任何程序都慢该如何解决

vmware虚拟机运行速度卡慢原因分析及解决办法大全（一）

linux执行命令特别慢,Linux运行速度太慢的关键原因全都在这了

计算机启动慢 原因,电脑开机慢的原因

vmware虚拟机运行速度卡慢原因分析及解决办法大全

win10系统下，vscode运行Golang程序很慢，好久没有输出结果

计算机打开资源管理器 特别慢,win10“此电脑”打开慢怎么办-处理win10此电脑打开很缓慢的方法 - 河东软件园...

【已解决】.py程序一直卡着不动，单步调试也是一直卡着不动该怎么办？

Python代码执行慢的原因是什么？如何优化Python代码的性能？

代码运行如此缓慢的5个原因以及如何修复

程序莫名卡顿、运行速度大幅降低的一种可能因素

如何解决GitHub打开缓慢甚至失败的问题

鸿蒙系统如何添加桌面小程序,微信Windows版更新至3.0：批量管理联系人，小程序可添加至桌面...

发表评论

推荐文章

《论文笔记》A Frontier-Based Approach for Autonomous Exploration

win7服务器建网站教程,win7搭建Web服务器教程

Windows 10中使用CMD测试IP端口联通性的方法

xbox键 禁用_如何在Windows 10上禁用Xbox成就通知

电脑常见故障分析（一、﻿﻿CPU的典型故障剖析）

热门文章

lenovo联想 ThinkPad E14 Gen 2,E15 Gen 2 AMD(20T6,20T7,20T8,20T9)原厂Win10系统镜像下载

U盘做成系统安装盘

RAC环境中ORA-01157: cannot identifylock data file 9 - see DBWR trace file

i7处理器好吗_i3处理器和i5等处理器有什么区别？大部分小白都被坑过

i7 13790F和i7 13700F有什么区别？i7 13790F值得购买吗

3分钟了解入门「机器学习」该学习什么？（下）

磁盘性能指标--IOPS、吞吐量

Linux 桌面玩家指南：03. 针对 Gnome 3 的 Linux 桌面进行美化

微信登录（网站应用）ASP.NET

catia V5R21 32位打开大型装配体非常卡，亲测可用解决方案

最新文章

恋爱必修课

Console Codes of The Elder Scrolls V: Skyrim

【职场篇】游戏开发社招求职面试指南②——公司选择

【DjangoDRF+缓存+JWT+RabbitMQ 七万字总结】

重磅福利 | 知乎上赞同数最高的1000个回答2019最新版

数学公式测试

c++用一级运算比较大小_原神主c角色用谁比较好 主c角色及圣遗物搭配攻略

【比特熊故事汇】4月MVP英雄故事：微软携手英特尔，特别“投资企划”披露

Android App安装包瘦身计划

【超全超详细】2W字零基础小白黑客学习路线，知识体系（附学习路线图

各大高校自曝状态一览，排名不分先后

Brytenwalda

龙之气息服务器维护,【龙之气息:从入坑到肝硬化】

游戏开发程序员求职面试指南

一支仙股和一个仙人救了高合

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

计算机启动慢原因,电脑开机慢的原因

计算机打开资源管理器特别慢,win10“此电脑”打开慢怎么办-处理win10此电脑打开很缓慢的方法 - 河东软件园...

xbox键禁用_如何在Windows 10上禁用Xbox成就通知

电脑常见故障分析（一、CPU的典型故障剖析）

c++用一级运算比较大小_原神主c角色用谁比较好主c角色及圣遗物搭配攻略

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载