4.0 CPU性能监控
CPU性能表现如何一般从三个方面来衡量:运行队列、利用率和上下文切换。正如前文所提及的,性能表现的好坏和基线数据(或预期)是密不可分的。对大部分系统而言,一些基本的性能预期如下:
- 运行队列——每个处理器运行队列中不应该超过1-3个线程。例如,一个双核的系统中,运行队列长度不应该超过6。(译注:即一个系统的load average值不应该大于核数的4倍。)
- CPU利用率——假如CPU被充分利用了,那么必须达到以下的占比划分:
- User Time占65%-70%
- System Time占30%-35%
- Idle占0%-5%
- 上下文切换——上下文切换的次数和CPU利用率相关。假设CPU利用率达到了上述的占比划分,大量的上下文切换也是可以接受的。
Linux系统有很多工具可以用来统计这些指标。我们将首先来看vmstat和top。
4.1 vmstat工具的使用
vmstat带来的额外性能开销很小,因此,在一个高负载系统上一直运行该工具是可行的,即使你并不想长久地统计它的性能数据。该工具有两种运行模 式:统计模式和采样模式。采样模式每隔一个指定的时间间隔会统计和输出一个结果。这种模式在统计一个持久负载下的性能数据时非常有用。下面是一个 vmstat在指定时间间隔为1秒时的输出示例:
上面输出中CPU相关各列的意义如下:
列名 | 含义 |
r | 运行队列的长度,即等待执行的线程数目 |
b | 处于阻塞状态或者等待IO完成状态的线程数目 |
in | 系统中断的数目 |
cs | 上下文切换的数目 |
us | CPU执行用户态线程的时间占比 |
sys | CPU执行系统态线程占用的时间占比,包含内核和中断两部分 |
wa | CPU处于等待状态的时间占比(CPU等待状态即所有线程都处于被阻塞或者等待IO完成状态) |
id | CPU处于完全空闲状态的时间占比 |
4.2 案例分析:CPU的持续耗用
在下面的案例中,系统CPU已经被完全用尽。
从上面输出,我们可以得出以下推论:
- 系统中有大量的中断和少数的上下文切换,看起来是某个进程正在请求访问硬件设备。
- CPU用户态耗用占了85%以上,同时只有少量的上下文切换,进一步证明了有一个进程一直在占用CPU。
- 运行队列长度达到可以接受的上限,甚至在几个瞬间已经超过了这个上限。
4.3 案例分析:调度器过载
在下面的案例中,内核调度器一直忙于上下文切换。
从上面的输出,我们可以得出以下推论:
- 上下文切换的次数远大于中断的次数。内核必须消耗大量的时间用于上下文切换。
- 大量的上下文切换导致了CPU利用率的不平衡。从用户态CPU占用极低和Wait IO态CPU占用极高可以明显看出来。
- 因为CPU处于等待IO状态,运行队列开始堆积,等待IO的线程数也开始堆积。
4.4 mpstat工具的使用
如果系统有多个处理器内核,你可以使用mpstat命令来监控各个核。Linux内核把双核处理器看作为两个处理器。因此,一个双核双处理器系统会 被认为有4个处理器。mpstat提供了vmstat类似的CPU统计功能,不过mpstat还按CPU核的粒度提供了统计数据。
4.5 案例分析:未充分使用的处理器负载
在下面的案例中,系统有4个CPU内核,有两个CPU耗用型的进程将其中两个核(CPU0和CPU1)充分利用,第三个核正在执行内核和系统调用(CPU3),第四个核(CPU2)处于空闲状态。
Top命令显示了有3个进程(nobody、mysql、apache)几乎各自占用了其中的一整个CPU内核:
你可以通过ps命令的PSR字段判断哪一个进程占用了哪一个CPU内核。
4.6 结论
CPU的性能监控包含如下要点:
- 检查运行队列,保证每个处理器的运行队列长度不超过3。
- 保证CPU的利用率在用户态和系统态的比例在70/30和65/35之间。
- 如果CPU在系统态所花的时间更多,可能不仅仅是过载的原因,尝试重新设置一下进程的优先级
- 运行IO型的进程比运行CPU型的进程更有收益(译注:是指在CPU利用率较高时?)
转载至:http://www.cnblogs.com/wujianlundao/archive/2013/01/03/2843072.html
相关推荐
### Linux操作系统性能监控工具和指标分析 #### 一、绪论 Linux作为一种广泛使用的开源操作系统,在服务器管理和维护中扮演着重要角色。对于初级系统工程师来说,掌握Linux性能监控的基础知识和工具至关重要。本文...
通过阅读《经典 Linux系统性能监控 中文版》,读者不仅可以掌握如何监控和优化Linux系统性能,还能提升对系统问题的诊断能力。无论是对于运维人员、系统管理员,还是开发人员,这本书都能提供宝贵的指导,帮助他们更...
只有掌握了行之有效的分析工具和方法,我们才能针对性的分析问题,为了使大家能清晰地从不同角度进行系统性能分析,本文从CPU、内存、IO、网络四个方面详细讲解有关linux系统性能监控的内容
在运维和开发过程中,对Linux系统的性能监控是确保服务稳定性和效率的关键环节。本文将深入探讨Linux性能监控的重点,包括CPU、内存、IO和网络子系统的监控,以及如何针对不同类型的應用进行优化。 1. **CPU性能...
通过模块化的设计,该项目旨在实现对分布式Linux 系统的性能监控和分析。所有源码均经过严格测试,可以直接运行,可以放心下载使用。有任何使用问题欢迎随时与博主沟通,第一时间进行解答!Linux系统是一个免费使用...
### 基于Linux的计算系统性能监控 #### 摘要解读与核心知识点 本文主要探讨了在分布式高性能计算环境中进行轻量级、低负载的持续性能监控的重要性及其实施方法。作者提出了一款名为PerfMon的开源性能监控工具,该...
需要监控Linux服务器系统性能吗?尝试下面这些系统内置或附件的工具吧。大多数Linux发行版本都装备了大量的监控工具。这些工具提供了能用作取得相关信息和系统活动的量度指标。你能使用这些工具发现造成性能问题可能...
总结,远程监控Linux系统性能是保证服务稳定性和可用性的必要手段。通过网络通信和守护进程,我们可以实现高效、实时的监控,从而提前预警并解决潜在的性能问题,降低运维成本。这种解决方案不仅适用于大型数据中心...
在Linux系统管理中,性能监控是一项至关重要的任务,它能够帮助我们及时发现并解决系统可能出现的问题,优化系统资源的利用。...通过熟练掌握和应用这些性能监控脚本,你将能够更有效地管理和维护你的Linux系统。
根据给定的文件信息,我们可以深入探讨Linux系统与性能监控的关键知识点,这涵盖了从系统监控的基本概念到具体的工具使用,以及对CPU、虚拟内存、I/O和网络监控的深度解析。 ### Linux系统与性能监控概览 #### ...
### Linux下nmon性能监控工具的安装与配置详解 #### 一、引言 在Linux环境中,性能监控是一项至关重要的任务。通过实时监控系统资源使用情况,可以及时发现潜在的问题,确保系统的稳定运行。Nmon是一款非常实用的...
优化Linux系统性能的过程是一个持续的迭代过程,需要不断地监控、分析和调整。通过对系统资源的深入理解和使用适当的监控工具,可以有效地定位问题,提高系统效率,确保服务的稳定性和响应速度。在实际操作中,还应...
linux 系统资源监控nmon+生成Excle报告 备注:1.生成报告错误时解析,跟换CPU个数,一般都OK; 2.上传文件3份:监控软件一份、解析文件一份、命令说明一份; 3.多尝试几次;本人认为很好用;
常见的Linux性能监控工具包括`top`、`vmstat`、`iostat`、`netstat`等。 - **配置工具**: 安装后还需要根据实际情况配置这些工具,以便更好地适应特定的监控需求。 #### 三、CPU介绍 **3.1 Context Switches(上...
Linux系统性能监控是运维工作中至关重要的一环,它可以帮助我们及时发现和解决问题,保持系统的稳定运行。nmon(Nigel's Monitoring Tool for AIX and Linux)就是一款强大的性能监控工具,尤其适用于那些需要实时...
【nmon】Linux服务器性能监控工具详解 在Linux操作系统中,性能监控是系统管理员不可或缺的任务,以便及时...通过正确使用nmon16e_mpginc和nmon.tar,无论是在CentOS 7还是其他Linux系统中,都能实现有效的性能监控。
4. **性能监控**:通过对系统资源使用的监控,分析系统的性能瓶颈,以便进行相应的优化。 #### 四、监控工具的部署与配置 1. **Nagios部署**:首先需要在服务器上安装Nagios核心组件及相关插件。配置文件中需要指定...
Linux系统性能监控是运维工作中至关重要的一环,它可以帮助我们及时发现和解决问题,确保系统的稳定运行。nmon(Nigel's Monitoring Tool for AIX and Linux)就是一款强大的性能监控工具,适用于多种Linux平台。这...
Linux 性能监控命令是 Linux 操作系统中用于监控和优化系统性能的命令集。这些命令可以帮助系统管理员和开发者监控系统的性能、 troubleshooting 故障、优化系统配置等。 1. Crond 命令 Crond 命令是 Linux 操作...