我司的某个 Laravel 项目,通过 Laravel 的定时任务模块在每天晚上 8 点钟群发消息给用户,之前一直运行良好。前天发现用户收到通知的时间大约在晚上 10 点多,当时以为只是服务器负载比较高而导致的发送较慢,就没有太在意,然而昨天的消息居然延迟到了次日凌晨一点多才送达,而且是所有用户都是在那个时间点收到的,而不是想象中从晚上 8 点开始逐渐收到。
首先看出问题的定时任务的执行逻辑:
ShouldQueue
,因此真正的消息推送会由给队列来处理。由于我们这个项目才刚启动不久,用户量在万级别,因此不太可能是第一步出问题,通过查看相对应的 SQL 执行记录,耗时在数百毫秒,因此可以排除步骤 1。
接下来看步骤 2,由于定时任务本身不执行具体的发送消息动作,只是把任务序列化之后存储到 Redis,这个步骤的效率完全取决于 Redis 服务器的吞吐量,于是查看晚上 8 点到次日凌晨 1 点 Redis 服务器的负载,发现都不高,因此可以排除是因为 Redis 服务器负载过高而导致的问题。
既然定时任务本身没有问题,那就开始排查具体执行推送任务的队列处理器。
由于这个项目业务量还不大,只用了一台服务器来执行队列处理器,使用 Supervisor 启动了 4 个队列处理器,启动命令是
php artisan queue:work --sleep=3 --tries=3 --timeout=3600 --memory=512
查看该服务器在晚上 8 点到次日凌晨 1 点的负载,也属于正常水平,不像是因为其他队列任务占用了队列处理器资源而导致推送队列没有被及时处理。
这下有点懵逼,感觉一切指标都正常,但就是出毛病了。
在各项指标没有问题的情况下,那只好通过日志来尝试复原当时服务器上发生的事情。
根据之前的分析,我先假定在晚上 8 点的时候,定时任务已经完成了自己的工作,将需要推送的消息存入了 Redis,所以我查看了队列处理器的输出日志,这个是通过 Supervisor 的配置实现的,在 Supervisor 的配置中通过
stdout_logfile=/project_path/storage/logs/worker.log
可以将队列的输出重定向到这个日志文件。
使用 less
命令查看这个日志文件,并跳转到晚上 8 点左右的日志,里面的内容类似:
[2018-08-18 20:06:54][ZyW9eRuMLB5goQyCO2EKv3hBkb77Ong0] Processing: App\Jobs\ParseUserIP
[2018-08-18 20:07:05][pXcIaQ93sLx5XH9NJYpbb3CDqVtMhT40] Processing: App\Jobs\ParseUserIP
[2018-08-18 20:07:10][IFedJb6OZwUaV5dlhFodoXk56SNk7RLE] Processing: App\Jobs\ParseUserIP
[2018-08-18 20:07:14][wyK42WyxaF5DR7J4O61h4p7Pud85VK2g] Processing: App\Jobs\ParseUserIP
[2018-08-18 20:07:15][FL7HERldD93pRYdrwG0xUMNo1TFpWpuI] Processing: App\Jobs\ParseUserIP
[2018-08-18 20:08:11][FL7HERldD93pRYdrwG0xUMNo1TFpWpuI] Processed: App\Jobs\ParseUserIP
[2018-08-18 20:08:11][EIUznJysjWbOt5MlzmMJVsan2nnD9XgK] Processing: App\Jobs\ParseUserIP
[2018-08-18 20:08:51][EIUznJysjWbOt5MlzmMJVsan2nnD9XgK] Processed: App\Jobs\ParseUserIP
[2018-08-18 20:08:51][ZTlzghKI7vPTIcNodu0yMwSDTcK5PsJi] Processing: App\Jobs\ParseUserIP
[2018-08-18 20:09:04][ZTlzghKI7vPTIcNodu0yMwSDTcK5PsJi] Processed: App\Jobs\ParseUserIP
当队列处理器开始处理某个任务时就会输出一条 Processing
,当执行完毕时会输出 Processed
,当有很多个任务在同时执行时,我们可以根据中括号里面的那个字符串(即任务 ID)来区别不同的任务。
仔细观察上面的日志,可以发现 ParseUserIP
这个任务耗时比较长,比如 ID 为 FL7HERldD93pRYdrwG0xUMNo1TFpWpuI
的任务,开始执行的时间是 20:07:15,而结束时间是 20:08:11,花了将近一分钟的时间。持续往下翻可以发现有大量的 ParseUserIP
任务出现长耗时的情况,而且一直持续,耗时 1 分钟以上的不在少数。
于是我查看了一下这个任务的代码,是调用淘宝的 IP 接口来查询用户 IP 归属地:
$ret = (new \GuzzleHttp\Client())->get('http://ip.taobao.com/service/getIpInfo.php?'.http_build_query(['ip' => $ip]));
之前这个接口都是秒回,现在这种情况应该是淘宝的这个接口本身出现了不稳定的情况。
这下有点明白问题出现在哪里了,由于每次用户登录都会触发 ParseUserIP
这个任务,所以系统里一直有大量的 ParseUserIP
任务待处理,在淘宝接口没有出现不稳定之前,这些任务几乎都是瞬间完成,因此一切正常。
而当淘宝接口开始不稳定,返回数据的时间从秒级变成分钟级,ParseUserIP
任务就开始大量积压,而 Laravel 的队列处理器是按照入队列的时间逐个去处理异步任务的,因此即使我们在晚上 8 点就将推送任务存入 Redis,也需要等待队列处理将之前积压的 ParseUserIP
任务全部完成才会开始被处理。
调用 Http 接口不会大量占用 CPU 和内存资源,这也解释了为什么服务器负载不高。
找到问题之后,解决起来就很简单了:
Laravel 教程 - 电商实战
Laravel 教程 - 电商进阶
Original url: Access
Created at: 2018-10-10 14:15:24
Category: default
Tags: none
未标明原创文章均为采集,版权归作者所有,转载无需和我联系,请注明原出处,南摩阿彌陀佛,知识,不只知道,要得到
java windows火焰图_mob64ca12ec8020的技术博客_51CTO博客 - 在windows下不可行,不知道作者是怎样搞的 监听SpringBoot 服务启动成功事件并打印信息_监听springboot启动完毕-CSDN博客 SpringBoot中就绪探针和存活探针_management.endpoint.health.probes.enabled-CSDN博客 u2u转换板 - 嘉立创EDA开源硬件平台 Spring Boot 项目的轻量级 HTTP 客户端 retrofit 框架,快来试试它!_Java精选-CSDN博客 手把手教你打造一套最牛的知识笔记管理系统! - 知乎 - 想法有重合-理论可参考 安宇雨 闲鱼 机械键盘 客制化 开贴记录 文本 linux 使用find命令查找包含某字符串的文件_beijihukk的博客-CSDN博客_find 查找字符串 ---- mac 也适用 安宇雨 打字音 记录集合 B站 bilibili 自行搭建 开坑 真正的客制化 安宇雨 黑苹果开坑 查找工具包maven pom 引用地 工具网站 Dantelis 介绍的玩轴入坑攻略 --- 关于轴的一些说法 --- 非官方 ---- 心得而已 --- 长期开坑更新 [本人问题][新开坑位]关于自动化测试的工具与平台应用 机械键盘 开团 网站记录 -- 能做一个收集的程序就好了 不过现在没时间 -- 信息大多是在群里发的 - 你要让垃圾佬 都去一个地方看难度也是很大的 精神支柱 [超级前台]sprinbboot maven superdesk-app 记录 [信息有用] [环境准备] [基本完成] [sebp/elk] 给已创建的Docker容器增加新的端口映射 - qq_30599553的博客 - CSDN博客 [正在研究] Elasticsearch, Logstash, Kibana (ELK) Docker image documentation elasticsearch centos 安装记录 及 启动手记 正式服务器 39 elasticsearch 问题合集 不断更新 6.1.1 | 6.5.1 两个版本 博客程序 - 测试 - bug记录 等等问题 laravel的启动过程解析 - lpfuture - 博客园 OAuth2 Server PHP 用 Laravel 搭建带 OAuth2 验证的 RESTful 服务 | Laravel China 社区 - 高品质的 Laravel 和 PHP 开发者社区 利用Laravel 搭建oauth2 API接口 附 Unauthenticated 解决办法 - 煮茶的博客 - SegmentFault 思否 使用 OAuth2-Server-php 搭建 OAuth2 Server - 午时的海 - 博客园 基于PHP构建OAuth 2.0 服务端 认证平台 - Endv - 博客园 Laravel 的 Artisan 命令行工具 Laravel 的文件系统和云存储功能集成 浅谈Chromium中的设计模式--终--Observer模式 浅谈Chromium中的设计模式--二--pre/post和Delegate模式 浅谈Chromium中的设计模式--一--Chromium中模块分层和进程模型 DeepMind 4 Hacking Yourself README.md update 20211011
Laravel China 简书 知乎 博客园 CSDN博客 开源中国 Go Further Ryan是菜鸟 | LNMP技术栈笔记 云栖社区-阿里云 Netflix技术博客 Techie Delight Linkedin技术博客 Dropbox技术博客 Facebook技术博客 淘宝中间件团队 美团技术博客 360技术博客 古巷博客 - 一个专注于分享的不正常博客 软件测试知识传播 - 测试窝 有赞技术团队 阮一峰 语雀 静觅丨崔庆才的个人博客 软件测试从业者综合能力提升 - isTester IBM Java 开发 使用开放 Java 生态系统开发现代应用程序 pengdai 一个强大的博主 HTML5资源教程 | 分享HTML5开发资源和开发教程 蘑菇博客 - 专注于技术分享的博客平台 个人博客-leapMie 流星007 CSDN博客 - 舍其小伙伴 稀土掘金 Go 技术论坛 | Golang / Go 语言中国知识社区
最新评论