cpu负载多少算正常,cpu负载100怎么解决

首页 > 经验 > 作者：YD1662022-10-31 02:31:03

作者：任坤

现居珠海，先后担任专职 Oracle 和 MySQL DBA，现在主要负责 MySQL、mongoDB 和 Redis 维护工作。

本文来源：原创投稿

*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

1、背景

某项目的开发环境，单台虚拟机装了1套mongo集群用于测试，1个mongos 3节点config 1shard * 3副本，总计7个mongo实例。 mongo版本4.2.19，OS为centos 7.9。

测试结束后CPU负载一直维持在50%左右，而此时mongo的qps已经下降为0。

这台机器上只安装了mongo，将所有mongo实例关闭，cpu负载立即恢复正常，再将mongo实例开启，过了一会cpu负载又开始飙升。场景能复现，且确认是跟mongo实例有关系。

2、诊断

执行top命令，cpu的usr已经达到了40%，但是前几个进程的%cpu加起来远远凑不够数。

cpu负载多少算正常,cpu负载100怎么解决(1)

查看mongos的qps，确实没有执行用户命令了。

cpu负载多少算正常,cpu负载100怎么解决(2)

dstat查看整体负载(vmstat格式化做的不好，最后几列总是对不齐整)。

cpu负载多少算正常,cpu负载100怎么解决(3)

除了cpu负载不正常，其余指标均正常，中断和上下文切换也不算高，不太可能是这两个引发的。 perf record -ag -- sleep 10 && perf report 查看cpu执行情况。

cpu负载多少算正常,cpu负载100怎么解决(4)

确实有大量mongo调用，但是API命名不直观，无法猜测对应的执行逻辑。

至此，确认是mongo实例引发的问题，但是mongo的应用连接为0，看调用API栈也找不到有用信息。

回到本文开头，top进程的cpu利用率加起来远远小于cpu总体负载，大概率是有频繁短时进程偷走了这部分CPU资源，导致top命令来不及捕获统计。

sar -w 1 查看每秒生成的进程数，平均每秒新建80多个进程，应该就是它了。

cpu负载多少算正常,cpu负载100怎么解决(5)

要抓出频繁建立短时进程的应用，可以采用execsnoop，该工具通过 ftrace 实时监控进程的 exec() 行为，并输出短时进程的基本信息，包括进程 PID/PPID、命令行参数。

#下载execsnoop# cd /usr/bin wget https://raw.githubusercontent.com/brendangregg/perf‐tools/master/execsnoop chmod 755 execsnoop

以下是输出内容，全是监控系统在执行，不停的连接mongo并对输出结果执行grep过滤，每个操作都会衍生一个新线程/进程，10s捕获了400多条记录。

cpu负载多少算正常,cpu负载100怎么解决(6)

将zabixx进程关闭，cpu马上恢复正常，找到了元凶。

我们其他环境也采用了zabbix监控，但是都没有遇到类似问题。

该节点部署了7个mongo实例，zabbix默认对每个mongo实例都进行监控，相当于执行损耗放大了7倍，而该机器是一台只有4核CPU的虚拟机。

这些因素凑齐了就会爆发问题。这是个开发环境，暂时关闭了zabbix监控，后续要对监控逻辑进行优化，尽量减少连接db的次数以及grep调用链的长度。

3、小结

当机器cpu负载持续高涨却抓取不到top进程时，可以采用execsnoop抓取短时进程，类似工具还有iosnoop、opensnoop。

,

栏目热文

负载是进线还是出线（负载端是进线还是出线）
阅读全文>>2022-10-31 02:43:17
电流和负载有什么关系（电机启动电流与负载关系）
阅读全文>>2022-10-31 02:40:11
什么叫做负载（什么是负载什么是负荷）
阅读全文>>2022-10-31 03:17:05
洗衣机出现负载怎么解决（滚筒洗衣机负载啥意思）
阅读全文>>2022-10-31 03:11:23
负荷与负载有什么区别（感性负载与容性负载的区别）
阅读全文>>2022-10-31 03:06:45
电机负载与电流的关系（电机负载与功率关系）
阅读全文>>2022-10-31 03:06:07
负载通常指的是什么（负载有哪三种）
阅读全文>>2022-10-31 03:19:20
充电器空载是什么意思（电瓶充电器显示空载是什么情况）
阅读全文>>2022-10-31 03:08:38
什么叫负载（网卡负载是什么意思）
阅读全文>>2022-10-31 03:08:53
负载怎么理解（负载是输出还是输入）
阅读全文>>2022-10-31 03:20:28

文档排行

本站推荐

哪款透明手机壳不发黄（透明手机壳有不变黄的吗）
阅读全文>>2022-11-24 17:33:43
大熊猫还是一级保护动物吗（大熊猫还是不是一级保护动物）
阅读全文>>2024-06-04 04:49:53
赤道地图全图（赤道图解）
阅读全文>>2024-06-01 21:43:11
在雨中歌词表达了什么感情（有雨这首歌表达了什么情感）
阅读全文>>2024-04-03 02:59:56
雪梨水怎么煮止咳化痰（冰糖雪梨止咳化痰做法）
阅读全文>>2022-11-29 15:33:04
防暑降温注意事项（防暑解暑药一览表）
阅读全文>>2024-03-10 23:59:52

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.