Redis超时排查的示例分析

发布时间:2022-01-05 17:54:09 作者:小新
来源:亿速云 阅读:143

这篇文章给大家分享的是有关Redis超时排查的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

前两天的工作中,突然收到告警,提示 Redis 挂了,同时大群也在说某某 Redis 连接超时了。当初以为是有大问题,谁知道它过了一会儿就恢复了。那个时候,我登上服务器,查看监控。第一时间看看 QPS:

Redis超时排查的示例分析  

可以看到 QPS 并不高,但是中间有段时间没取到数据是怎么回事?那么继续看看 Redis 的 cpu 使用率:

Redis超时排查的示例分析  

可以看到 cpu 已经饱和,这也就能解释为何断图了,因为 redis 是单线程,在使用 cpu 100% 以后,就无法处理其他的命令了,zabbix 也就无法执行 info 命令取 qps 了。那么已经知道是 cpu 使用饱和造成的问题,那么到底是什么原因呢?那么继续查看,cpu 使用高的这段时间有没有慢日志:

Redis超时排查的示例分析  

好像也不是导致 cpu 高的凶手,这就难排查了,这个实例是 1 主 1 从。那么我看看从库的 cpu 使用情况看看:

Redis超时排查的示例分析  

卧槽,怎么回事,从库没有使用的怎么 cpu 也用到了 74%?这不科学啊?管他的,看看从库有没有慢日志:

Redis超时排查的示例分析  

卧槽,怎么回事?从库没人使用啊。看看是否只读:

127.0.0.1:6103> CONFIG GET "slave-read-only"
1) "slave-read-only"
2) "yes"
127.0.0.1:6103> 
 

看来是只读的,这把我给整懵了。最后突然想到是主库在这个点有 big key 过期,而主库过期 key 操作慢是不会记录慢日志的,从库的 key 过期是由主库发起 DEL 指令删除的。这时从库就会记录慢日志,从上面慢日志可以看到这些 DEL 操作最大的 335ms,怪不得会有应用连接超时的。

再使用命令 info commandstats 看看:

Redis超时排查的示例分析  


感谢各位的阅读!关于“Redis超时排查的示例分析”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

推荐阅读:
  1. sql server中死锁排查的示例分析
  2. golang中http连接超时和传输超时的示例分析

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

redis

上一篇:Java一切都是对象怎么理解

下一篇:Java初学者要注意哪些问题

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》