いつも見ているMuninのお気に入りグラフを紹介してみた。
ESXi
まずはハイパーバイザーの監視。こちらの有志からいただいたRubyプラグインを使っている。ログイン情報以外では、1行目を /usr/bin/ruby にしてメモリの表示単位をMBからGBに変更した程度。
ファン回転数
サーバーの空冷ファン監視。IPMIから拾っている。「ipmitool munin」などでググると有志のプラグインが多数ある。
CPU・メモリ温度
サーバーのCPUやメモリ温度などを監視。これも上と同じくIPMIから拾っているもの。
以下のように /etc/munin/munin.conf でメール通知も設定している。
[server;www] address 127.0.0.1 use_node_name yes df._dev_sda1.warning 90 usbrh.tempreture.warning 40.00 usbrh.tempreture.critical 50.00 usbrh.humidity.critical 56.00 ipmi_sensor_u_degrees_c.cpu_temp.warning 70.00 ipmi_sensor_u_degrees_c.cpu_temp.critical 80.00 ipmi_sensor_u_degrees_c.dimma1_temp.warning 60.00 ipmi_sensor_u_degrees_c.dimma2_temp.warning 60.00 ipmi_sensor_u_degrees_c.dimmb1_temp.warning 60.00 ipmi_sensor_u_degrees_c.dimmb2_temp.warning 60.00 ipmi_sensor_u_volts._2v.warning 11.500: ipmi_sensor_u_volts._2v.critical 11.200: ipmi_sensor_u_volts.__3vcc.critical 2.789: ipmi_sensor_u_volts.__3vcc.warning 2.959: ipmi_sensor_u_volts._vcc.critical 4.246: ipmi_sensor_u_volts._vcc.warning 4.480: ipmi_sensor_u_volts._v_dual.critical 4.244: ipmi_sensor_u_volts._v_dual.warning 4.487: ipmi_sensor_u_volts.vccp.critical 0.441: ipmi_sensor_u_volts.vccp.warning 0.495: ipmi_sensor_u_volts.vbat.warning 2.595: ipmi_sensor_u_volts.vbat.critical 2.400: ipmi_sensor_u_volts.__3v_aux.warning 2.959: ipmi_sensor_u_volts.__3v_aux.critical 2.789: ipmi_sensor_u_volts.vdimm.critical 1.092: ipmi_sensor_u_volts.vdimm.warning 1.200: ipmi_sensor_u_rpm.fan1.critical 500: load.warning :1.5 load.critical :2.0
電圧
サーバーの供給電圧を監視。これも上と同じくIPMIから拾っている。電圧が低下するとサーバー稼働が根底から危うくなるので、11.5Vを下回るとワーニングメールが飛ぶようにしている。
[server;www] address 127.0.0.1 use_node_name yes df._dev_sda1.warning 90 usbrh.tempreture.warning 40.00 usbrh.tempreture.critical 50.00 usbrh.humidity.critical 56.00 ipmi_sensor_u_degrees_c.cpu_temp.warning 70.00 ipmi_sensor_u_degrees_c.cpu_temp.critical 80.00 # ipmi_sensor_u_degrees_c.system_temp.warning 50.00 # ipmi_sensor_u_degrees_c.peripheral_temp.warning 48.00 ipmi_sensor_u_degrees_c.dimma1_temp.warning 60.00 ipmi_sensor_u_degrees_c.dimma2_temp.warning 60.00 ipmi_sensor_u_degrees_c.dimmb1_temp.warning 60.00 ipmi_sensor_u_degrees_c.dimmb2_temp.warning 60.00 ipmi_sensor_u_volts._2v.warning 11.500: ipmi_sensor_u_volts._2v.critical 11.200: ipmi_sensor_u_volts.__3vcc.critical 2.789: ipmi_sensor_u_volts.__3vcc.warning 2.959: ipmi_sensor_u_volts._vcc.critical 4.246: ipmi_sensor_u_volts._vcc.warning 4.480: ipmi_sensor_u_volts._v_dual.critical 4.244: ipmi_sensor_u_volts._v_dual.warning 4.487: ipmi_sensor_u_volts.vccp.critical 0.441: ipmi_sensor_u_volts.vccp.warning 0.495: ipmi_sensor_u_volts.vbat.warning 2.595: ipmi_sensor_u_volts.vbat.critical 2.400: ipmi_sensor_u_volts.__3v_aux.warning 2.959: ipmi_sensor_u_volts.__3v_aux.critical 2.789: ipmi_sensor_u_volts.vdimm.critical 1.092: ipmi_sensor_u_volts.vdimm.warning 1.200: ipmi_sensor_u_rpm.fan1.critical 500: load.warning :1.5 load.critical :2.0
電力量
これも大好きw 自宅電力量の監視。別記事のようにすごぶる安定感でスマートメーターからの数値をモニタリングしてくれる。
UPS
オムロンの無停電電源を監視。コンセントからの供給電圧もモニタリングできるので便利。
$ cat /etc/munin/plugins/nut_by50s_AT_localhost ~前略~ in.warning 97:105 in.critical 96: out.label Output Voltage (v) out.critical 97:105 charge.label Battery Charge (%) charge.draw AREA charge.colour 00aaaa charge.warning 30: charge.critical 10: load.label UPS Load (%) load.colour ff0000 load.warning :70 ~以下略~
気温・湿度
サーバーケース内の温度と湿度を監視。このサーバーは一般家庭の部屋に置いてるため天候で湿度がガンガン上下する汗。
USBデバイスのusbrh動作には、こちらを使わせていただいている。カーネルアップデートを行ってモジュールが見えなくなったまま放置していた期間、グラフが途切れてしまった。usbrhは長らく使っているお気に入りのセンサー。