博客
关于我
Linux kdump Crash故障定位分析详解
阅读量:812 次
发布时间:2023-02-01

本文共 1068 字,大约阅读时间需要 3 分钟。

1、服务器出现卡顿及OOM排查过程

如果Linux服务器突然出现访问卡顿、响应变慢等问题,初步判断可能是系统性能瓶颈或内存泄漏(OOM,Out Of Memory)等问题。具体表现为输入命令时命令行响应迟缓,按Tab键补全不灵敏等。

在遇到Linux服务器性能问题时,快速诊断是关键。以下是一些常用的命令和方法,能够帮助你在最短时间内定位问题:

uptime

查看系统运行时间及负载情况。例如,uptime命令会显示系统当前时间、登录用户数及系统负载。负载值反映的是单位时间内CPU使用情况,数值越高说明系统压力越大。

mpstat -P ALL 1

查看所有CPU的负载情况。mpstat命令可以显示每个CPU的使用率及等待I/O操作的进程数量,帮助分析系统CPU瓶颈问题。

pidstat 1

查看系统中各进程的状态及资源使用情况。pidstat命令可以显示进程ID、用户、CPU、内存使用情况等信息,有助于找出内存泄漏或资源占用过大的进程。

iotop

监控磁盘I/O吞吐量。iotop命令可以显示各设备的读写速率,帮助分析是否存在磁盘性能问题导致的系统卡顿。

free -msar -n DEV

查看系统内存使用情况及内存泄漏情况。free命令可以显示内存使用情况,-msar选项可以显示内存分区使用情况,-n DEV选项可以显示设备内存使用情况。

sar -n TCP,ETCP

查看网络流量统计。sar命令可以显示网络传输速率及各端口的连接状态,帮助分析是否存在网络拥堵问题。

在实际排查中,建议先从系统负载入手。通过uptime命令查看系统负载是否过高。如果发现负载值远高于系统CPU核数,说明系统可能存在多个进程竞争CPU资源的问题。

如果系统负载正常,但仍然存在卡顿问题,建议检查是否存在磁盘I/O瓶颈或网络拥堵情况。通过iotop和sar命令可以进一步确认这一点。

在排查过程中,如果发现内存使用情况异常,可以通过free命令查看内存使用情况,确认是否存在内存泄漏问题。如果系统内存使用接近或达到上限,可能需要调整内核参数(如vmalloc)或优化应用程序内存使用方式。

如果通过上述方法仍未找到问题所在,建议检查是否存在进程资源竞争问题。通过pidstat命令可以查看各进程的CPU和内存使用情况,找出占用过多资源的进程并进行优化或终止。

总之,快速定位Linux服务器性能问题需要从系统负载、内存使用、磁盘I/O、网络流量等多个维度进行全面排查。通过结合使用所述命令,可以在最短时间内找到问题根源并采取相应措施。

转载地址:http://ycwfk.baihongyu.com/

你可能感兴趣的文章
percona-xtrabackup 备份
查看>>
Perfect,华为爆出 Redis 宝典,原来 Redis 性能可压榨到极致
查看>>
SpringBoot集成OpenOffice实现doc文档转html
查看>>
springboot自动扫描添加的BeanDefinition源码解析
查看>>
Perl Socket传输(带注释)
查看>>
ROS中机器人的强化学习路径规划器
查看>>
rocketmq存储结构_rocketmq 消息存储
查看>>
perl---2012学习笔记
查看>>
Perl6 必应抓取(1):测试版代码
查看>>
perl学习之内置变量
查看>>
perl正则表达式中的常用模式
查看>>
Perl的基本語法
查看>>
perl输出中文有乱码
查看>>
Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 大数据ssh权限问题 hadoop起不来 hadoopssh错
查看>>
PermissionError:Python 中的 [Errno 13]
查看>>
PermissionError:[Errno 13] 权限被拒绝:‘/manage.py‘
查看>>
Permutation
查看>>
return torch._C._broadcast_coalesced(tensors, devices, buffer_size)RuntimeError: NCCL Error 2:unhand
查看>>
perspective意思_2020年12月英语四级词汇讲解丨考点归纳:perspective
查看>>
PE启动盘和U启动盘(第三十六课)
查看>>