django|电子爱好者

admin管理员组
文章数量:1568419

django

背景

在django项目中使用django-apschedule来实现定时任务，使用的是BackgroundScheduler调度类，该调度的实现是通过后台线程的方式执行定时任务。其中任务都是持久化到数据库中的。

在项目的运行过程中，因为数据库的异常，导致定时任务线程异常终止，即使数据库后续恢复正常，但也不再继续执行。我多次尝试复现未果，在开启定时任务期间，手动将数据库连接断开，定时任务执行失败，然后再将数据库建立连接，定时任务竟然重新恢复了，这让我一时摸不着头脑。

具体的错误日志如下，通过分析，是update_job连接数据库异常，没有任何捕获机制，然后层层网上抛，最终导致线程停止，可以很肯定的是，绝对是因为数据库连接失败导致的定时任务失败，那为什么无法复现呢？

Traceback (most recent call last):File "/usr/local/python3/lib/python3.7/threading.py", line 926, in _bootstrap_innerself.run()File "/usr/local/python3/lib/python3.7/threading.py", line 870, in runself._target(*self._args, **self._kwargs)File "/usr/local/python3/lib/python3.7/site-packages/apscheduler/schedulers/blocking.py", line 32, in _main_loopwait_seconds = self._process_jobs()File "/usr/local/python3/lib/python3.7/site-packages/apscheduler/schedulers/base.py", line 1009, in _process_jobsjobstore.update_job(job)File "/usr/local/python3/lib/python3.7/site-packages/django_apscheduler/util.py", line 105, in func_wrapperresult = func(*args, **kwargs)File "/usr/local/python3/lib/python3.7/site-packages/django_apscheduler/jobstores.py", line 249, in update_jobwith transaction.atomic():File "/usr/local/python3/lib/python3.7/site-packages/django/db/transaction.py", line 189, in __enter__if not connection.get_autocommit():File "/usr/local/python3/lib/python3.7/site-packages/django/db/backends/base/base.py", line 389, in get_autocommitself.ensure_connection()File "/usr/local/python3/lib/python3.7/site-packages/django/utils/asyncio.py", line 33, in innerreturn func(*args, **kwargs)File "/usr/local/python3/lib/python3.7/site-packages/django/db/backends/base/base.py", line 219, in ensure_connectionself.connect()File "/usr/local/python3/lib/python3.7/site-packages/django/db/utils.py", line 90, in __exit__raise dj_exc_value.with_traceback(traceback) from exc_valueFile "/usr/local/python3/lib/python3.7/site-packages/django/db/backends/base/base.py", line 219, in ensure_connectionself.connect()File "/usr/local/python3/lib/python3.7/site-packages/django/utils/asyncio.py", line 33, in innerreturn func(*args, **kwargs)File "/usr/local/python3/lib/python3.7/site-packages/django/db/backends/base/base.py", line 200, in connectself.connection = self.get_new_connection(conn_params)File "/usr/local/python3/lib/python3.7/site-packages/django/utils/asyncio.py", line 33, in innerreturn func(*args, **kwargs)File "/usr/local/python3/lib/python3.7/site-packages/django/db/backends/postgresql/base.py", line 187, in get_new_connectionconnection = Database.connect(**conn_params)File "/usr/local/python3/lib/python3.7/site-packages/psycopg2/__init__.py", line 122, in connectconn = _connect(dsn, connection_factory=connection_factory, **kwasync)
django.db.utils.OperationalError: connection to server at "xxxx.postgresql.svc.cluster.local" (xx.xx.xx.xx), port xxxx failed: server closed the connection unexpectedly
This probably means the server terminated abnormally
before or while processing the request.

源码分析原因

可以先看下BackgroundScheduler的实现方式，在start方法中创建了个子线程。

class BackgroundScheduler(BlockingScheduler):_thread = Nonedef start(self, *args, **kwargs):if self._event is None or self._event.is_set():self._event = Event()BaseScheduler.start(self, *args, **kwargs)self._thread = Thread(target=self._main_loop, name='APScheduler')self._thread.daemon = self._daemonself._thread.start()def shutdown(self, *args, **kwargs):super(BackgroundScheduler, self).shutdown(*args, **kwargs)self._thread.join()del self._thread

其中_main_loop在BlockingScheduler中实现，是一个死循环，执行_process_jobs方法

class BlockingScheduler(BaseScheduler):...def _main_loop(self):wait_seconds = TIMEOUT_MAXwhile self.state != STATE_STOPPED:self._event.wait(wait_seconds)self._event.clear()wait_seconds = self._process_jobs()...

再看_process_jobs中的内容，在BaseScheduler实现的，主要流程如下，先找到所有要执行的job，然后进行遍历运行并更新Job的状态。之前的错误日志，也就是这里的update_job抛出异常，而这里并没有捕获异常，最终层层往上抛，update_job -> _process_jobs -> _main_loop，最终线程异常终止。

def _process_jobs(self):for jobstore_alias, jobstore in six.iteritems(self._jobstores):try:due_jobs = jobstore.get_due_jobs(now)except Exception as e:...continue...for job in due_jobs:...try:executor.submit_job(job, run_times)except BaseException:......jobstore.update_job(job)

那为什么复现不了呢？这个是因为，关闭数据库连接时，程序不一定可以正好运行在update_job，可以看到前面的get_due_jobs进行了异常捕获，如果这里抛出数据库连接异常是可以捕获到的，然后跳过后面的操作，等待下一次定时任务的执行，如果还是失败，则再次等待，所以这里的异常不会抛到最上层导致线程停止。

但如果某个时机，上面连接数据库都成功了，到update_job这里异常抛出，则会导致整个线程停止，定时任务不再执行。

那如何解决该问题呢？

搭建demo

首先我们搭建一个demo出来，模拟复现该问题。

创建django项目


django-admin startproject apschedule_demopython manage.py startapp demopython manage.py makemigrationspython manage.py migrate

在settings.py中配置到好数据库信息

DATABASES = {"default": {"ENGINE": "django.db.backends.postgresql","NAME": "apschedule_demo","HOST": "xxxx","PORT": 5432,"USER": "xxx","PASSWORD": "xxx"}
}

根据django-apschedule官方提供的文档搭建demo

在settings.py中添加该APP

INSTALLED_APPS = (# ..."django_apscheduler",
)

创建目录demo/management/commands，并在其下面创建runapscheduler.py文件，代码内容如下：

import loggingfrom django.conf import settingsfrom apscheduler.schedulers.blocking import BlockingScheduler
from apscheduler.triggers.cron import CronTrigger
from django.core.management.base import BaseCommand
from django_apscheduler.jobstores import DjangoJobStorelogger = logging.getLogger(__name__)def my_job():# Your job processing logic here...print("job..")class Command(BaseCommand):help = "Runs APScheduler."def handle(self, *args, **options):scheduler = BlockingScheduler(timezone=settings.TIME_ZONE)scheduler.add_jobstore(DjangoJobStore(), "default")scheduler.add_job(my_job,trigger=CronTrigger(second="*/3"),  # Every 3 secondsid="my_job",  # The `id` assigned to each job MUST be uniquemax_instances=1,replace_existing=True,)logger.info("Added job 'my_job'.")try:logger.info("Starting scheduler...")scheduler.start()# 因为上面是非阻塞开启定时任务，所以这里需要阻塞，不让主线程结束。while True:time.sleep(10)except KeyboardInterrupt:logger.info("Stopping scheduler...")scheduler.shutdown()logger.info("Scheduler shut down successfully!")

可以通过python manage.py runapscheduler执行上面的命令运行定时任务，该脚本创建了一个每3秒执行一次的任务。

复现

我们将断点打在jobstore.update_job(job)上，然后使用debug模式进行调试，当程序运行到断点上时，将数据库关闭，然后程序继续运行，则会报错，并抛出异常，线程停止了运行。至此，我们复现了该问题。

线程重启

我一开始想，我可以判断该线程是否异常，如果异常则将线程重启就好了

    while True:if not scheduler._thread.is_alive():scheduler._thread.start()time.sleep(10)

但事与愿违，抛出了异常，异常信息如下：

RuntimeError: threads can only be started once

通过查看官方文档可以知道，线程的start方法只能调用一次。

listener

apschedule中提供了监听器机制，也就是在定时任务的成功、失败等状态都可以通过提前注册的listener方法来进行回调。但通过分析源码，其并不能捕获到定时任务线程的异常。

下面是简化了代码的listeners的原理流程：

外部通过add_listener方法注册回调方法
在定时任务线程主流程_process_jobs中发生的各个事件添加到events中
遍历events事件，然后通过与注册的回调方法mask进行匹配，匹配上则调用回调方法

class BaseScheduler:def __init__(...):self._listeners = []def add_listener(self, callback, mask=EVENT_ALL):self._listeners.append((callback, mask))def _process_jobs(self):events = []...events.append(event)...for event in events:self._dispatch_event(event)def _dispatch_event(self, event):for cb, mask in listeners:if event.code & mask:try:cb(event)except BaseException:self._logger.exception('Error notifying listener')

如果线程本身挂了，回调方法是不可执行的。

捕获线程中函数的异常

如果update_job抛出异常导致线程停止，那我捕获它的异常，然后再continue，等待下次定时任务运行再重试不就好了，但是这就需要改动源码，能不能改源码就尽量不改。所以这边我采用了继承BackgroundScheduler类，然后再重写_process_jobs方法来解决。

在重写的_process_jobs方法中，对父类的_process_jobs()进行异常的捕获，然后再不断的进行重试，这样即使update_job抛出异常了，也可以不断的进行尝试恢复，直至成功。

class DemoBackgroundScheduler(BackgroundScheduler):def _process_jobs(self):while True:try:return super()._process_jobs()except BaseException:time.sleep(5)class Command(BaseCommand):help = "Runs APScheduler."def handle(self, *args, **options):scheduler = DemoBackgroundScheduler(timezone=settings.TIME_ZONE)...

然后再次尝试复现该问题，可以发现在断开数据库后，它能够一直进行重试，线程没有停止，当数据库恢复运行后，job执行成功，不再抛出异常。

欢迎关注，互相学习，共同进步~

我的个人博客
公众号：编程黑洞

本文标签： django

版权声明：本文标题：django 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1716884931a523505.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

django

django

背景

源码分析原因

搭建demo

线程重启

listener

捕获线程中函数的异常

相关链接

欢迎关注，互相学习，共同进步~

更多相关文章

django

【django学习】——Django介绍和实战（开发简易版博客网页）

12. Django 第三方功能应用

基于Windows平台的Django本地部署和腾讯云服务器上部署（1）

大数据毕设选题 - 深度学习股票预测系统（python Django）

VSCode 安装配置 Python + Django + MySQL + Html + CSS

Django入门学习

Django知识点笔记

【删除Django迁移生成的数据库中表后如何恢复】

django manytomany字段属性through和through_fields

精通 Django（九）

django基于大数据的汽车销售可视化系统的设计与实现论文(1)

Django微信公众号开发（一）公众号内网页授权登录后微信获取用户信息

django修改模型后迁移报错

Python Django强大的web mvc开发框架

[django项目] 用户注册登录模块复盘+总结

Django中A server error occurred. Please contact the administrator的问题解决

django项目中，web运行提示：A server error occured. please contact the administrator

前端Vue+后端Django实现登录注册（包括第三方登录：QQ）

django学习笔记

发表评论

推荐文章

无法打开office，提示“应用程序无法正常启动(0xc0000142)“。（已解决）

esp开发板启动和工作不正常的可能原因

分享成为高效程序员的7个重要习惯

Win10+Python3.8+GPU版tensorflow2.x环境搭建最简流程

Xcode 不同版本的链接地址

热门文章

tomcat正常启动但是对应的网页却无法访问------解决办法

＜＜游戏设计艺术＞＞笔记

在虚拟机VirtualBox7.0.6+openEuler20.03TSL上安装部署openGauss3.1.1数据库快速（一键）安装指导手册

我为什么放弃了win7系统

chrome浏览器版本和Chromedriver不匹配问题解决办法selenium.common.exceptions.SessionNotCreatedException

Linux 自动挂载U盘 实现热插拔

Mindjet MindManager 2023中文版注册序列号

计算机系统中输入汉字的方法有,如何解决Win10正式版无法输入中文汉字问题

macOS Sequoia 15.0 (24A335) Boot ISO 原版可引导镜像下载

Redis 的各项功能解决了哪些问题？

最新文章

BurpSuite学习笔记-BurpSuite CA证书下载及浏览器导入

uniapp 安卓 跳转到系统浏览器_Android 实现浏览器跳转APP应用，网页也可以跳转APP...

微信自动跳转到手机默认浏览器代码的实现原理

手机微信如何设置浏览器打开时提醒

使用postman interceptor拦截浏览器和手机请求

windows系统激活方式有几种

安卓手机实现无需下载即可预览pdf文件

微信内置浏览器打开apk应用下载链接被拦截解决方法

教你微信跳转手机默认浏览器提示的实现方式

iOS之推荐六款不错的 iOS 15 Safari 浏览器扩展

如何查看windows系统激活状态

在微信中点击链接直接跳转到手机外部默认浏览器代码实现

解决部分android手机自带浏览器下载 apk 文件的时候提示无法识别该类型的文件...

2022年最新常用的浏览器排行榜单

HBuilderX “未检测到手机或浏览器” （手机）

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

Linux 自动挂载U盘实现热插拔

uniapp 安卓跳转到系统浏览器_Android 实现浏览器跳转APP应用，网页也可以跳转APP...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载