OCIモニタリングでサーバの死活監視を行う

モニタリング

※本記事は 2021/10/16 時点のものです

はじめに

OCIには「モニタリング」というサービスがあり、
下記のような特徴があります。

・OCI上のリソースを監視することができる
 ※サーバの死活監視、CPU使用率の監視などが行える
・OCIモニタリングの「アラーム」機能にて、指定条件を満たした時にEメール/Slack等で通知する、という事ができる
・無料で使える!

今回はこの OCIの「モニタリング」サービスを使用して
OCI上のサーバの死活監視を行ってみます。

マニュアル:
モニタリング
https://docs.oracle.com/ja-jp/iaas/Content/Monitoring/home.htm

トピックの作成

まずは通知先のグループとなる「トピック」を作成します。

OCIのWebコンソール画面より、
メニュー「≡」⇒「開発者サービス」⇒「通知」を選択します。

「トピックの作成」をクリックします。

ここでは下記のように入力し、「作成」をクリックします。

項目名設定値
名前topic-test01
説明汎用トピック

名前が「topic-test01」のトピックが作成されたことを確認できます。

サブスクリプションの作成

次に実際の通知先となる「サブスクリプション」を作成します。

作成されたトピックをクリックします。

「サブスクリプションの作成」をクリックします。

ここでは下記のように入力し、「作成」をクリックします。

項目名 設定値
プロトコル電子メール
電子メールolaboratory.info@gmail.com

作成された「サブスクリプションOCID」をクリックします。

現状では下記のように「確認待ち」と表示されています。
ここで、先ほど設定した電子メールに メールが届いているかを確認します。

下記のようなメールが届いていますので、
「Confirm subscription」をクリックします。

下記のような画面が表示されました。
サブスクリプションの画面に戻ります。

「確認待ち」の表示が無くなり、
PENDING → ACTIVE に変わっています。

アラームの作成

続いて、監視対象・監視のしきい値・通知先を設定する「アラーム」を作成します。

OCIのWebコンソール画面より、
メニュー「≡」⇒「Observability & Management」⇒「アラーム定義」をクリックします。

「アラームの作成」をクリックします。

アラームの作成画面にて、
下記のように設定していきます。

項目名設定値
アラーム名alarm-tsocts01-alive
アラームの重大度クリティカル
アラーム本体tsocts01 生死監視アラート
メトリック・ネームスペースoci_computeagent
メトリック名CpuUtilization
閾値1m
統計Mean
※tsocts01 はあらかじめ作成しておいたサーバ(コンピュート)の名前です。
項目名設定値
ディメンション名resourceDisplayName
ディメンション値tsocts01
演算子なし
トリガー遅延分数1
※tsocts01 はあらかじめ作成しておいたサーバ(コンピュート)の名前です。
項目名設定値
宛先サービスNotifications Service
トピックtopic-test01
メッセージの書式フォーマットされたメッセージの送信

最後に「アラームの保存」をクリックします。

アラームが作成されました。

死活監視による通知が来ることの確認

実際にサーバをシャットダウンしてみます。
しばらくすると下記のようなメールが届きます。

「Status」に FIRING と表示され、
「Body」にはアラームの作成時に「アラーム本体」に設定した文字列が表示されます。
また、下側のボタンの「View Alarm in Console」をクリックすると
OCI Webコンソールのアラームの画面を表示できます。

Webコンソールのアラームの画面は次のようになっています。
緑で「OK」 だった表示が 赤で「起動」と表示されていますね。

復旧の通知が来ることの確認

シャットダウンしたサーバを今度は起動してみます。
しばらくすると下記のようなメールが届きます。

Status は OK と表示され、
Body にはアラームの作成時の「アラーム本体」に設定した文字列です。
Type が「FIRING_TO_OK」と表示され、復旧したようなことが分かります。

Webコンソールのアラームの画面は次のようになっています。
緑で「OK」 の表示に戻っており、下側のグラフからは
いつの時間帯が異常状態であったかがわかります。

さいごに

このOCIの「モニタリング」サービスで容易にサーバの死活監視を行うことができました。
CPU使用率などの監視もアラームの定義から行うことができます。

以前はEメールで通知される内容がわかりにくかったのですが、
2021/9/29 のリリース(機能改善)で内容がとても分かり易くなりました!

Friendly formatting now available for alarm messages
Services: Monitoring
Release Date: Sept. 29, 2021

You can now apply friendly formatting to email messages triggered by alarms. See example alarm messages as well as instructions for updating your alarms.

https://docs.oracle.com/en-us/iaas/releasenotes/changes/8f8eedf6-99f9-46fc-b273-724b075e99c8/

無料で使えますし、どんどん使っていこうと思います。