linux的性能调优 / 憋错料

单机调优：

分析性能瓶颈的原因，解决它。

cpu子系统

内存子系统

IO子系统

网络系统

@cpu子系统调优

cpu技术指标 xeon E5520 2.27GHz 8192kb

# cat /proc/cpuinfo

# dmidecode

# dmidecode --type cache

# dmidecode --type processor

中断 --- 某个事件发生，cpu停止执行当前指令，转而执行引起该事件的程序产生的指令，执行完毕，恢复执行之前被暂停的指令。 IO引起（存储设备、网络传输）

上下文切换

内核处理过程---控制优先级

内核除了调用各种驱动程序，完成对硬件的驱动

对系统各种资源的调配：

硬件资源

调整各个进程的优先级，对进行进行调度。

完成以上任务的也是由相应的进程完成，这些进程称为系统进程（内核进程）

用户进程

运行队列（系统负载）uptime

# uptime

14:24:16 up 4:20, 5 users, load average: 0.06, 0.09, 0.18

1分钟，5分钟，15分钟

负载，代表就是系统过去的压力，数字越大，说明系统越忙。

负载就是代表运行队列的平均长度。如果数字越大，说明排队等候cpu处理的进程就越多。

单核cpu：

4 过去的时间里，运行队列里平均长度是4。（事实上3个进程在等候，1个进程正在被cpu处理）。也就是说，负载是4.

一般一个核心的cpu它的负载（运行队列）不应该大于3.

双核cpu：

4 过去的时间里，平均每个核心的cpu运行队列里长度是4/2=2。

因为平均下载，都比常用指标3要低，所以系统不繁忙。

cpu利用率

用户进程us , 用户执行的程序

内核调度sy , 内核进行调度（处理中断，进行上下文切换）

空闲 id

等待io wa

vmstat,top,uptime,mpstat,dstat,sar -u / -q

# top

可以交互界面下，动态查看负载，系统的进程等信息。

在查找性能瓶颈的时候，主要用它来查看当前哪些进程最活跃。最活跃进程通常都是占用资源最多的进程。

shift + M 以内存使用百分比排序

shift + P 以cpu使用百分比排序

# vmstat 2 <---每2秒中输出一次最新的数据。

# vmstat 2 3 <---只输出3次数据

procs --system-- -----cpu-----

r b in cs us sy id wa st

0 0 728 913 29 2 68 0 0

0 0 301 255 2 1 98 0 0

0 0 472 569 1 1 98 0 0

r 当前运行队列中有多少个进程（uptime看到的负载）

b 被阻塞进程有多少个，只要看到数字，都应该留意，一般被阻塞的进程都是由于IO导致。

in 中断数，数字越大，说明操作系统越活跃，操作系统在充分发挥它该做的事情。

cs 上下文切换数，数字越大，说明操作系统越活跃，操作系统在充分发挥它该做的事情。

us 用户进程使用的cpu百分比

sy 内核进程使用的cpu百分比

us ： sy = 7 : 3

id 空间的cpu百分比

wa cpu花在等待的时间的备份比。一般产生wa时间都是由于某个进程被阻塞了，在慢设备上读写数据，然后让cpu被迫停止等待指令执行完毕。

一直都出现wa时间，就应该注意。

# mpstat -p ALL <---分别查看每个核心的使用情况

# yum install sysstat -y

# sar -u <---输出过去24小时内sar -u每10分钟捕获一次历史数据。

# sar -u 2

# sar -q 2

案例数据分析

===================================================================

@内存子系统调优

虚拟内存

内存页 page

作为系统分配内存空间的最基本的单位。内核默认的内存也多大？

内存分页（paging）--内核就必须经常扫描内存空间并且收回其中未被使用的内存页,把数据同步到硬盘

kswapd

pdflush 进程负责将内存中的内容和文件系统进行同步操

# free -m

total used free shared buffers cached

Mem: 3925 2114 1810 0 109 1461

-/+ buffers/cache: 543 3381

Swap: 4095 0 4095

buffers

缓冲区，用于缓存块设备的数据。这些数据是不经过文件系统的数据。

cached

高速缓存，用于缓存文件系统的数据。默认情况下，Linux在内存空间允许的情况下，把曾经打开过的文件都缓存到这里。

如果放在内存中的数据被修改过了，这些数据叫做“脏数据”。pdflush 进程定期扫描内存中的脏数据，把脏数据同步到磁盘上。同步之后的数据，叫做干净数据。

如果出现内存空间不足的时候，就会把脏数据马上同步到磁盘，把同步后的数据，从内存中删除掉。

如果内存中的数据并不是来自磁盘，而是进程在运行过程中产生，如果遇到内存空间不足的时候，而这部分数据当前不许要马上使用，就会被置换到swap分区。

# vmstat 2 3

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----

r b swpd free buff cache si so bi bo in cs us sy id wa st

0 0 0 1849492 112304 1500544 0 0 48 18 644 751 23 2 75 0 0

0 0 0 1848020 112312 1501792 0 0 0 12 1248 813 3 1 95 1 0

0 0 0 1851492 112312 1498248 0 0 0 0 707 392 1 0 99 0 0

si 有多少数据从swap加载到内存中（page in）

so 有多少数据从内存中保存到swap中（page out）

swpd 使用了多少的swap分区空间

如果发现某个系统是存在内存瓶颈，想知道哪个进程使用了大量的内存，使用top指令查看最活跃的进程，或者按内存使用百分比输出结果。

找到这个进程之后，就可以使用strace去跟踪进程，看一下进程到底在调用什么的系统函数，结合进程本身作用，推断出进程背后在做些什么？

例如：如果现在系统出现性能瓶颈，top指令发现mysqld进程最活跃》

# strace -F -p 2234 <--- 2234是mysqld进程pid

主页面故障：

程序运行的时候所需要的数据并不在内存中，就会产生主页面故障。

次页面故障

程序运行的时候所需要的数据已经在内存中，就会产生次页面故障。

vmstat , time , sar -B ,free

# /usr/bin/time -v date

2012年 12月 28日星期五 16:29:28 CST

...

Major (requiring I/O) page faults: 0 主页面故障

Minor (reclaiming a frame) page faults: 234 次页面故障

...

Page size (bytes): 4096

# sar -B 2

=================================================================

@IO子系统调优

IO 输入输出（写读硬盘）

IOPS计算

IOPS 每秒钟完成多少个IO指令。越多就越好。

在最好发挥硬盘性能的条件下去测试的：

10K 120-150 IOPS

15K 150-200 IOPS

IO吞吐量计算

每个IO指令完成了多少的数据。数字越大，代表设备性能越好。

IO分类

随机IO

顺序IO

iostat

# iostat -d sda2 2

Linux 2.6.32-220.el6.x86_64 (www.upl.com) 2012年12月28日 _x86_64_ (2 CPU)

Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn

sda2 3.21 127.32 22.67 3079282 548200 <---开机到现在的平均数据

Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn

sda2 0.00 0.00 0.00 0 0 <--过去2秒钟的平均数据

tps 平均每秒钟发生的事务数（IO） = IOPS

Blk_read/s 平均每秒中读取了多少块数据。 1块=1扇区=512字节

Blk_read 过去2秒钟中读取了多少块的数据

# iostat -d sda2 2 -k

Linux 2.6.32-220.el6.x86_64 (www.upl.com) 2012年12月28日 _x86_64_ (2 CPU)

Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn

sda2 3.20 63.13 11.39 1539641 277756

-k 以KB 单位输出

-m 以MB 为单位输出

测试设备的读写性能，以下是顺序IO的测试结果：

# mount -o remount,sync /dev/sda6

# dd if=/dev/zero of=/rhci/1Gb bs=1M count=1024

记录了1024+0 的读入

记录了1024+0 的写出

1073741824字节(1.1 GB)已复制，55.7702 秒，19.3 MB/秒

# iostat -m -d sda6 2

Linux 2.6.32-220.el6.x86_64 (www.upl.com) 2012年12月28日 _x86_64_ (2 CPU)