Nagios から FreeBSD を監視するメモ。
メモリ、CPU とかプロセスの死活を監視する場合は何かしらの監視エージェントが必要になると思うが、NRPE はその監視エージェントにあたるソフトウェア。他にも似たようなエージェントはあるけどあまり使った事がないのでもっぱらこればかり。
普段は ports からインストールしてるけどこれだけはソースで任意のディレクトリに入れるようにしている。
バージョンがちょっと古いが利用するのはこれ。
- nagios-plugins 1.5
- nrpe 2.15
NRPE 用のユーザー作成
NRPE はデーモンとして起動するのでユーザーを作っておく。
# adduser ----- こんな内容で ----- Username : nagios Password : <disabled> Full Name : nagios Uid : 181 Class : Groups : nagios www Home : /usr/local/nagios Home Mode : Shell : /usr/sbin/nologin Locked : no
nagios-plugins のインストール
純正の監視用プラグインセットをまずはインストール。これがあれば大体は事足りる。
# cd /tmp # wget -q http://nagios-plugins.org/download/nagios-plugins-1.5.tar.gz # tar xfz nagios-plugins-1.5.tar.gz ; cd nagios-plugins-1.5 # ./configure \ --with-nagios-user=nagios \ --with-nagios-group=nagios # make ; make install
これで OK。
NRPE のインストール
# cd /tmp # wget -q http://cznic.dl.sourceforge.net/project/nagios/nrpe-2.x/nrpe-2.15/nrpe-2.15.tar.gz # tar xfz nrpe-2.15.tar.gz ; cd nrpe-2.15 # ./configure \ --enable-ssl \ --enable-command-args \ --with-ssl-lib=/usr/lib # make ; make install
次は NRPE 用のコンフィグを作成。サンプルをコピるか下記のような具合に書く。
# mkdir /usr/local/nagios/etc # vi /usr/local/nagios/etc/nrpe.cfg ----- sample ----- log_facility=daemon pid_file=/var/run/nrpe.pid server_port=5666 nrpe_user=nagios nrpe_group=nagios # 監視サーバ (接続元) ip を書く allowed_hosts=127.0.0.1,192.168.0.1 dont_blame_nrpe=1 allow_bash_command_substitution=0 debug=0 command_timeout=60 connection_timeout=300 # 監視用のコマンド command[check_load]=/usr/local/nagios/libexec/check_load -w $ARG1$ -c $ARG2$ command[check_disk]=/usr/local/nagios/libexec/check_disk -w $ARG1$ -c $ARG2$ -p $ARG3$ command[check_procs]=/usr/local/nagios/libexec/check_procs -c $ARG1$ -C $ARG2$ -a $ARG3$
次は起動用スクリプトの作成
# vi /usr/local/etc/rc.d/nrpe.sh ----- #!/bin/sh # # nrpe init script # NrpeBin=/usr/local/nagios/bin/nrpe NrpeCfg=/usr/local/nagios/etc/nrpe.cfg case "$1" in start) $NrpeBin -c $NrpeCfg -d echo ' nrpe start' ;; stop) killall -TERM nrpe echo ' nrpe stop' ;; restart) killall -HUP nrpe echo 'nrpe restart' ;; *) echo "Usage: ${0##*/}: { start | stop | restart }" 2>&1 exit 65 ;; esac exit 0
できたら起動してみる。
# /usr/local/etc/rc.d/nrpe.sh start
動いたら動作確認。
# /usr/local/nagios/libexec/check_nrpe -H 127.0.0.1 NRPE v2.15
後は監視サーバからも同じような感じで動作確認して上記のようになれば準備は OK。