博客
关于我
Linux kdump Crash故障定位分析详解
阅读量:812 次
发布时间:2023-02-01

本文共 1068 字,大约阅读时间需要 3 分钟。

1、服务器出现卡顿及OOM排查过程

如果Linux服务器突然出现访问卡顿、响应变慢等问题,初步判断可能是系统性能瓶颈或内存泄漏(OOM,Out Of Memory)等问题。具体表现为输入命令时命令行响应迟缓,按Tab键补全不灵敏等。

在遇到Linux服务器性能问题时,快速诊断是关键。以下是一些常用的命令和方法,能够帮助你在最短时间内定位问题:

uptime

查看系统运行时间及负载情况。例如,uptime命令会显示系统当前时间、登录用户数及系统负载。负载值反映的是单位时间内CPU使用情况,数值越高说明系统压力越大。

mpstat -P ALL 1

查看所有CPU的负载情况。mpstat命令可以显示每个CPU的使用率及等待I/O操作的进程数量,帮助分析系统CPU瓶颈问题。

pidstat 1

查看系统中各进程的状态及资源使用情况。pidstat命令可以显示进程ID、用户、CPU、内存使用情况等信息,有助于找出内存泄漏或资源占用过大的进程。

iotop

监控磁盘I/O吞吐量。iotop命令可以显示各设备的读写速率,帮助分析是否存在磁盘性能问题导致的系统卡顿。

free -msar -n DEV

查看系统内存使用情况及内存泄漏情况。free命令可以显示内存使用情况,-msar选项可以显示内存分区使用情况,-n DEV选项可以显示设备内存使用情况。

sar -n TCP,ETCP

查看网络流量统计。sar命令可以显示网络传输速率及各端口的连接状态,帮助分析是否存在网络拥堵问题。

在实际排查中,建议先从系统负载入手。通过uptime命令查看系统负载是否过高。如果发现负载值远高于系统CPU核数,说明系统可能存在多个进程竞争CPU资源的问题。

如果系统负载正常,但仍然存在卡顿问题,建议检查是否存在磁盘I/O瓶颈或网络拥堵情况。通过iotop和sar命令可以进一步确认这一点。

在排查过程中,如果发现内存使用情况异常,可以通过free命令查看内存使用情况,确认是否存在内存泄漏问题。如果系统内存使用接近或达到上限,可能需要调整内核参数(如vmalloc)或优化应用程序内存使用方式。

如果通过上述方法仍未找到问题所在,建议检查是否存在进程资源竞争问题。通过pidstat命令可以查看各进程的CPU和内存使用情况,找出占用过多资源的进程并进行优化或终止。

总之,快速定位Linux服务器性能问题需要从系统负载、内存使用、磁盘I/O、网络流量等多个维度进行全面排查。通过结合使用所述命令,可以在最短时间内找到问题根源并采取相应措施。

转载地址:http://ycwfk.baihongyu.com/

你可能感兴趣的文章
org.apache.ibatis.type.TypeException: Could not resolve type alias 'xxxx'异常
查看>>
org.apache.poi.hssf.util.Region
查看>>
org.apache.xmlbeans.XmlOptions.setEntityExpansionLimit(I)Lorg/apache/xmlbeans/XmlOptions;
查看>>
org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss for /
查看>>
org.hibernate.HibernateException: Unable to get the default Bean Validation factory
查看>>
org.hibernate.ObjectNotFoundException: No row with the given identifier exists:
查看>>
org.springframework.orm.hibernate3.support.OpenSessionInViewFilter
查看>>
org.springframework.orm.hibernate3.support.OpenSessionInViewFilter
查看>>
org.springframework.web.multipart.MaxUploadSizeExceededException: Maximum upload size exceeded
查看>>
org.tinygroup.serviceprocessor-服务处理器
查看>>
org/eclipse/jetty/server/Connector : Unsupported major.minor version 52.0
查看>>
org/hibernate/validator/internal/engine
查看>>
SQL-36 创建一个actor_name表,将actor表中的所有first_name以及last_name导入改表。
查看>>
ORM sqlachemy学习
查看>>
Ormlite数据库
查看>>
orm总结
查看>>
os.path.join、dirname、splitext、split、makedirs、getcwd、listdir、sep等的用法
查看>>
os.system 在 Python 中不起作用
查看>>
OSCACHE介绍
查看>>
SQL--合计函数(Aggregate functions):avg,count,first,last,max,min,sum
查看>>