同业务内,某实例CPU异常高
source link: https://zzyongx.github.io/blogs/one-instance-cpu-is-higher-than-other.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
同业务内,某实例CPU异常高
问题的现象:同业务有多个k8s实例,在QPS相同的情况下,某个实例的CPU使用率是其它实例的两倍。
1 CPU性能指标
QPS、CPU使用率体现到CPU上是IPS、IPC,通常这两个指标可以指引后续的排查。
实例 | IPS | IPC |
---|---|---|
正常 | 7,823,662,928 | 1.18 |
异常 | 17,944,647,861 | 1.12 |
- 正常、异常实例的IPC相差不大,但是IPS差了1倍,和CPU使用率的差异吻合;
- QPS相同,但是IPS不同,说明实例的很多指令在做QPS无关的事情。
2 IPS 差异
可以从IPS的差异入手,参考之前的:
最简单的方法,是看TOP线程的情况。我司的代码,会根据线程的功能,命名线程。(C语言可以使用 pthread_setname_np
,Java语言也有相关API。)
top -H -p <pid>
发现如下差异:
- 异常实例有很多的rdk线程,有40多个
ps -L -p <pid> | wc -l
; - 正常实例则没有rdk线程。
业务同学根据这个差异,很快定位到是配置错误。修改之后各个实例的CPU使用率均衡了。
Recommend
-
26
1业务需求:今日,公司要求对操作的业务和日志统一做处理,需要把业务表数据相关信息存入日志表中,比如表名,方法名,业务id,操作操作时间modifyTIme等等。除了在业务主动插入日志数据之外,有个比较好的方法就是用面向切面aop处理,明确跟业务逻辑分开,把业务...
-
55
这篇文章的目的很简单:通过电商的实例,将业务流程图和任务流程图之间的关联和区别以及在产品中的应用,讲解清楚。 流程和流程图 首先来看流程的定义: 《牛津词典》里,流程是指一个或一系列连续有规律的行动,这些行动以确定的方式发生或执行,促使特定结果的实...
-
8
组网图形 大中型WLAN网络简介 本文介绍的WLAN网络是指利用频率为2.4GHz或5GHz的射频...
-
5
数据分析师不是大学教授,数据分析师要在企业里做出成绩,靠的不是自己闭门造车,而是充分深入一线,合理的定义问题,勾起合作方的兴趣,找到合作方的真正需求,一步步推动,甚至曲线救国来实现。即使环境再艰难,我们也有办法。不要对自己丧失信心...
-
1
一、现状与问题 二、解决的思路 三、技术方案 四、建设成果 五、总结与未来展望一、现状与问题1、规模增长与运维能力发展之间的不平衡问题凸显伴随着最近几年...
-
9
实例猛涨10倍,美团数据库异常智能分析与诊断治理 金龙 2022-05-27 10:22:00
-
2
程序运行时CPU异常排查 作者: wencst 分类: JAVA,
-
1
Spring 6/Spring Boot 3新特性:优雅的业务异常处理 作者:爱科学的卫斯理 2022-10-26 07:14:25 当你使用Spring Boot(Spring MVC)进行RESTful API开发的时候,你会发现HTTP的状态码很多时候不能足够有效的传递错误...
-
8
cpu设计和实现(异常和中断)
-
9
工具名称:LogTrace 建议使用gradle作为项目管理工具,下面是一些建议的版本号:jdk8~11 gradle7+...
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK