ゆとりインフラエンジニアのブログ的な何か

駆け出しインフラエンジニアのブログ

Nagiosサーバを監視するbashスクリプトを書いた

【背景】

最近、Nagiosサーバを立ててみたけど、

Nagios自身が落ちてたら意味ないなー

と思ってもう一台Nagiosを立てるのもマンドクセ('A`)

 

そんな感じで、Nagiosのプロセス数を監視するbashスクリプト書いた

 Nagiosのプロセス数が0になると、アラートメールが飛ぶようになってる

(一応リカバリーメールも)

 

 

【事前準備】

Nagiosサーバ側には、NRPEとnagios-plugins-procsをインストールして、5666のポートを開けて、

nrpe.cfgには下記設定を反映させる。

command[check_nagios_procs]=/usr/lib64/nagios/plugins/check_procs -c 1: -a /usr/sbin/nagios

 

【設置】

適当なサーバーを見繕って、nagios-plugins-nrpeをインストールして、

あとは、下記スクリプトを適当なディレクトリにおいて、

適切な感じで設定してください。cronに設定する

 

bashスクリプト

nagios procs check

 

【終わりに】

あれ?素直にNagios入れたり外部監視ツール使ったほうがよくない?っておもいました。

ちなみに、自分はCMANとかMackerelとかの外部サービスを使ってます。