Linux服務(wù)器進(jìn)階 |
發(fā)布時間: 2012/8/10 10:27:19 |
我們在做Linux服務(wù)器的時候經(jīng)常會需要知道誰在做進(jìn)程切換,什么原因需要做進(jìn)程切換。 因?yàn)檫M(jìn)程切換的代價很高,我給出一個LMbench測試出來的數(shù)字:
Context switching – times in microseconds – smaller is better ————————————————————————- Host OS 2p/0K 2p/16K 2p/64K 8p/16K 8p/64K 16p/16K 16p/64K ctxsw ctxsw ctxsw ctxsw ctxsw ctxsw ctxsw ——— ————- —— —— —— —— —— ——- ——- my174.cm4 Linux 2.6.18- 6.1100 7.0200 6.1100 8.7400 7.7200 8.96000 9.62000 在我的很高端的服務(wù)器上,進(jìn)程切換的開銷在8us左右, 這個相對于高性能的服務(wù)器是不可接受的, 所以我們要在一個時間片內(nèi)盡可能的多做事情,而不是把時間浪費(fèi)在無謂的切換上。 好奇害死貓,我們來調(diào)查下誰在切換我們的進(jìn)程: [root@my174 admin]# dstat 1 —-total-cpu-usage—- -dsk/total- -net/total- —paging– —system– usr sys idl wai hiq siq| read writ| recv send| in out | int csw 0 0 100 0 0 0| 0 0 | 796B 1488B| 0 0 |1004 128 0 0 100 0 0 0| 0 0 | 280B 728B| 0 0 |1005 114 0 0 100 0 0 0| 0 0 | 280B 728B| 0 0 |1005 128 0 0 100 0 0 0| 0 0 | 280B 728B| 0 0 |1005 114 0 0 100 0 0 0| 0 320k| 280B 728B| 0 0 |1008 143 … 我們可以看到 csw的數(shù)目是 120/S, 但是dstat或者vmstat類似的工具并沒有告訴我們誰在干壞事。好吧!我們自己動手行吧。 祭出我們可愛的systemtap! [root@my174 admin]# cat >cswmon.stp #! /usr/bin/env stap # # global csw_count global idle_count probe scheduler.cpu_off { csw_count[task_prev, task_next]++ idle_count+=idle } function fmt_task(task_prev, task_next) { return sprintf(“%s(%d)->%s(%d)”, task_execname(task_prev), task_pid(task_prev), task_execname(task_next), task_pid(task_next)) } function print_cswtop () { printf (“%45s %10sn”, “Context switch”, “COUNT”) foreach ([task_prev, task_next] in csw_count- limit 20) { printf(“%45s %10dn”, fmt_task(task_prev, task_next), csw_count[task_prev, task_next]) } printf(“%45s %10dn”, “idle”, idle_count) delete csw_count delete idle_count } probe timer.s($1) { print_cswtop () printf(“————————————————————–n”) } CTRL+D 個腳本會每隔設(shè)定的時間打印出TOP 20切換最多的進(jìn)程和他的pid, 我們來看下結(jié)果把: [root@my174 admin]# stap cswmon.stp 5 Context switch COUNT swapper(0)->systemtap/11(908) 500 systemtap/11(908)->swapper(0) 498 swapper(0)->fct1-worker(2492) 50 fct1-worker(2492)->swapper(0) 50 swapper(0)->fct0-worker(2191) 50 fct0-worker(2191)->swapper(0) 50 swapper(0)->bond0(3432) 50 bond0(3432)->swapper(0) 50 stapio(879)->swapper(0) 26 swapper(0)->stapio(879) 25 stapio(879)->swapper(0) 19 swapper(0)->stapio(879) 17 swapper(0)->watchdog/9(31) 5 watchdog/9(31)->swapper(0) 5 swapper(0)->mysqld(18346) 5 mysqld(18346)->swapper(0) 5 swapper(0)->watchdog/13(43) 5 watchdog/13(43)->swapper(0) 5 swapper(0)->watchdog/14(46) 5 watchdog/14(46)->swapper(0) 5 idle 859 ————————————————————– … 我們可以看到進(jìn)程從哪里切換到哪里,并且發(fā)生了多少次, 最后一行,我打印出來idle的次數(shù),也就是說這時候系統(tǒng)沒啥事情做,就切換到idle(0)這個進(jìn)程去休息去了。 通過上面的調(diào)查,我們會很清楚的了解到我們系統(tǒng)的開銷發(fā)生在那里,方便我們定位問題。 本文出自:億恩科技【1tcdy.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |