`
m635674608
  • 浏览: 4905168 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

Linux系统和性能监控

阅读更多

4.0 CPU性能监控

CPU性能表现如何一般从三个方面来衡量:运行队列、利用率和上下文切换。正如前文所提及的,性能表现的好坏和基线数据(或预期)是密不可分的。对大部分系统而言,一些基本的性能预期如下:

  • 运行队列——每个处理器运行队列中不应该超过1-3个线程。例如,一个双核的系统中,运行队列长度不应该超过6。(译注:即一个系统的load average值不应该大于核数的4倍。)
  • CPU利用率——假如CPU被充分利用了,那么必须达到以下的占比划分:
    • User Time占65%-70%
    • System Time占30%-35%
    • Idle占0%-5%
  • 上下文切换——上下文切换的次数和CPU利用率相关。假设CPU利用率达到了上述的占比划分,大量的上下文切换也是可以接受的。

Linux系统有很多工具可以用来统计这些指标。我们将首先来看vmstat和top。

 

4.1 vmstat工具的使用

vmstat带来的额外性能开销很小,因此,在一个高负载系统上一直运行该工具是可行的,即使你并不想长久地统计它的性能数据。该工具有两种运行模 式:统计模式和采样模式。采样模式每隔一个指定的时间间隔会统计和输出一个结果。这种模式在统计一个持久负载下的性能数据时非常有用。下面是一个 vmstat在指定时间间隔为1秒时的输出示例:

image

上面输出中CPU相关各列的意义如下:

列名 含义
r 运行队列的长度,即等待执行的线程数目
b 处于阻塞状态或者等待IO完成状态的线程数目
in 系统中断的数目
cs 上下文切换的数目
us CPU执行用户态线程的时间占比
sys CPU执行系统态线程占用的时间占比,包含内核和中断两部分
wa CPU处于等待状态的时间占比(CPU等待状态即所有线程都处于被阻塞或者等待IO完成状态)
id CPU处于完全空闲状态的时间占比

 

4.2 案例分析:CPU的持续耗用

在下面的案例中,系统CPU已经被完全用尽。

image

从上面输出,我们可以得出以下推论:

  • 系统中有大量的中断和少数的上下文切换,看起来是某个进程正在请求访问硬件设备。
  • CPU用户态耗用占了85%以上,同时只有少量的上下文切换,进一步证明了有一个进程一直在占用CPU。
  • 运行队列长度达到可以接受的上限,甚至在几个瞬间已经超过了这个上限。

4.3 案例分析:调度器过载

在下面的案例中,内核调度器一直忙于上下文切换。

image

从上面的输出,我们可以得出以下推论:

  • 上下文切换的次数远大于中断的次数。内核必须消耗大量的时间用于上下文切换。
  • 大量的上下文切换导致了CPU利用率的不平衡。从用户态CPU占用极低和Wait IO态CPU占用极高可以明显看出来。
  • 因为CPU处于等待IO状态,运行队列开始堆积,等待IO的线程数也开始堆积。

4.4 mpstat工具的使用

如果系统有多个处理器内核,你可以使用mpstat命令来监控各个核。Linux内核把双核处理器看作为两个处理器。因此,一个双核双处理器系统会 被认为有4个处理器。mpstat提供了vmstat类似的CPU统计功能,不过mpstat还按CPU核的粒度提供了统计数据。

image

 

4.5 案例分析:未充分使用的处理器负载

在下面的案例中,系统有4个CPU内核,有两个CPU耗用型的进程将其中两个核(CPU0和CPU1)充分利用,第三个核正在执行内核和系统调用(CPU3),第四个核(CPU2)处于空闲状态。

Top命令显示了有3个进程(nobody、mysql、apache)几乎各自占用了其中的一整个CPU内核:

image

image

你可以通过ps命令的PSR字段判断哪一个进程占用了哪一个CPU内核。

image

 

4.6 结论

CPU的性能监控包含如下要点:

  • 检查运行队列,保证每个处理器的运行队列长度不超过3。
  • 保证CPU的利用率在用户态和系统态的比例在70/30和65/35之间。
  • 如果CPU在系统态所花的时间更多,可能不仅仅是过载的原因,尝试重新设置一下进程的优先级
  • 运行IO型的进程比运行CPU型的进程更有收益(译注:是指在CPU利用率较高时?)

转载至:http://www.cnblogs.com/wujianlundao/archive/2013/01/03/2843072.html

分享到:
评论

相关推荐

    Linux系统性能监控

    只有掌握了行之有效的分析工具和方法,我们才能针对性的分析问题,为了使大家能清晰地从不同角度进行系统性能分析,本文从CPU、内存、IO、网络四个方面详细讲解有关linux系统性能监控的内容

    Linux操作系统性能监控工具和指标分析V1.0

    适合初级系统工程师进行查看阅读,可作为工具书使用。

    Linux系统设计-项目旨在实现对分布式Linux 系统的性能监控和分析

    通过模块化的设计,该项目旨在实现对分布式Linux 系统的性能监控和分析。所有源码均经过严格测试,可以直接运行,可以放心下载使用。有任何使用问题欢迎随时与博主沟通,第一时间进行解答!Linux系统是一个免费使用...

    基于Linux的计算系统性能监控

    基于Linux的计算系统性能监控 基于Linux的计算系统性能监控

    Linux系统20个系统监控工具

    需要监控Linux服务器系统性能吗?尝试下面这些系统内置或附件的工具吧。大多数Linux发行版本都装备了大量的监控工具。这些工具提供了能用作取得相关信息和系统活动的量度指标。你能使用这些工具发现造成性能问题可能...

    记一次记一次Linux性能监控

    一次记一次Linux性能监控的流程和报告,有需要可以下载

    Linux系统与性能监控.docx

    Linux系统与性能监控.docx

    经典 Linux系统性能监控 中文版

    第一,概念和内容虽然老套,但都讲得很透彻,而且还很全面. 第二,理论结合实际,其中案例分析都不错. 第三,不花哨,采用的工具及命令都是最基本的,有助于实际操作.

    linux 系统资源监控+生成Excle报告

    linux 系统资源监控nmon+生成Excle报告 备注:1.生成报告错误时解析,跟换CPU个数,一般都OK; 2.上传文件3份:监控软件一份、解析文件一份、命令说明一份; 3.多尝试几次;本人认为很好用;

    Linux系统性能的远程监控.pdf

    Linux系统性能的远程监控.pdf

    Linux下nmon性能监控工具的安装

    笔者在安装性能监控工具nmon时记录了安装步骤,整个安装过程很简单,但是如果nmon版本与Linux系统版本不匹配,是无法运行的。鉴于此,笔者发表此文,希望能帮到和我一样遇到诸如此类问题的人。

    Linux系统性能监控工具nmon

    推荐绿色可用Linux系统性能监控工具nmon,可以实现对linux系统CPU,磁盘,网络的实时信息采集和查看

    Linux性能监控脚本

    对系统负载、CPU使用率、内存、交换分区、磁盘空间、用户登录情况进行监控,并写入监控日志、各项指标超过警告值则邮件报警

    用Python脚本实现对Linux服务器的监控

    目前Linux下有一些使用Python语言编写的Linux系统监控工具比如inotify-sync(文件系统安全监控软件)、glances(资源监控工具)在实际工作中,Linux系统管理员可以根据自己使用的服务器的具体情况编写一下简单实用的...

    企业Linux系统性能监控实战.pdf

    企业Linux系统性能监控实战.pdf

    Linux操作系统高性能集群监控管理之道

    本文讨论了如何将Java语言有效地用于Linux集群结点上的高性能监控。...对高性能监控而言,内核模块不是必要条件,这点很重要,因为它在Linux版本和分类之间提供了很大程度的可移植性,在监控器实现语言上有很多的选择。

    Linux系统设计-监控linux系统

    Linux系统具有高效的网络功能和稳定的性能,因此被广泛应用于服务器领域,Linux是云计算的核心组成部分,被广泛用于构建云平台和云服务。许多知名的云计算服务提供商都采用Linux系统作为其基础架构,一些游戏平台和...

    linux系统与网络监控【笔记】

    1.0 性能监测简介 1.1 判定应用的类型 1.2 判定基准信息 2.0 安装监测工具 3.0 CPU 介绍 3.1 Context Switches(上下文切换) 3.2 运行队列 3.3 CPU 利用率 4.0 CPU 性能监测 4.1 vmstat 工具的使用 4.2 案例分析:CPU...

    基于嵌入式Linux的远程视频监控系统

    考虑到小型专用化和高性能的要求,尤其是实用性的要求,本系统是在ARM嵌入式开 发平台进行,设计并实现了基于嵌入式Linux的远程视频监控系统。该系统是以嵌入式Linux 和控制器S3C2440为核心平台,通过嵌入式平台建立...

    Linux性能监控工具.xmind

    常用Linux系统下性能监控工具,通过xmind方式罗列整理,给运维或测试的同学,学习使用中作参考,希望可以帮到你!!

Global site tag (gtag.js) - Google Analytics