※本記事は 2021/10/16 時点のものです
はじめに
OCIには「モニタリング」というサービスがあり、
下記のような特徴があります。
・OCI上のリソースを監視することができる
※サーバの死活監視、CPU使用率の監視などが行える
・OCIモニタリングの「アラーム」機能にて、指定条件を満たした時にEメール/Slack等で通知する、という事ができる
・無料で使える!
今回はこの OCIの「モニタリング」サービスを使用して
OCI上のサーバの死活監視を行ってみます。
マニュアル:
モニタリング
https://docs.oracle.com/ja-jp/iaas/Content/Monitoring/home.htm
トピックの作成
まずは通知先のグループとなる「トピック」を作成します。
OCIのWebコンソール画面より、
メニュー「≡」⇒「開発者サービス」⇒「通知」を選択します。
「トピックの作成」をクリックします。
ここでは下記のように入力し、「作成」をクリックします。
項目名 | 設定値 |
---|---|
名前 | topic-test01 |
説明 | 汎用トピック |
名前が「topic-test01」のトピックが作成されたことを確認できます。
サブスクリプションの作成
次に実際の通知先となる「サブスクリプション」を作成します。
作成されたトピックをクリックします。
「サブスクリプションの作成」をクリックします。
ここでは下記のように入力し、「作成」をクリックします。
項目名 | 設定値 |
---|---|
プロトコル | 電子メール |
電子メール | olaboratory.info@gmail.com |
作成された「サブスクリプションOCID」をクリックします。
現状では下記のように「確認待ち」と表示されています。
ここで、先ほど設定した電子メールに メールが届いているかを確認します。
下記のようなメールが届いていますので、
「Confirm subscription」をクリックします。
下記のような画面が表示されました。
サブスクリプションの画面に戻ります。
「確認待ち」の表示が無くなり、
PENDING → ACTIVE に変わっています。
アラームの作成
続いて、監視対象・監視のしきい値・通知先を設定する「アラーム」を作成します。
OCIのWebコンソール画面より、
メニュー「≡」⇒「Observability & Management」⇒「アラーム定義」をクリックします。
「アラームの作成」をクリックします。
アラームの作成画面にて、
下記のように設定していきます。
項目名 | 設定値 |
---|---|
アラーム名 | alarm-tsocts01-alive |
アラームの重大度 | クリティカル |
アラーム本体 | tsocts01 生死監視アラート |
メトリック・ネームスペース | oci_computeagent |
メトリック名 | CpuUtilization |
閾値 | 1m |
統計 | Mean |
項目名 | 設定値 |
---|---|
ディメンション名 | resourceDisplayName |
ディメンション値 | tsocts01 |
演算子 | なし |
トリガー遅延分数 | 1 |
項目名 | 設定値 |
---|---|
宛先サービス | Notifications Service |
トピック | topic-test01 |
メッセージの書式 | フォーマットされたメッセージの送信 |
最後に「アラームの保存」をクリックします。
アラームが作成されました。
死活監視による通知が来ることの確認
実際にサーバをシャットダウンしてみます。
しばらくすると下記のようなメールが届きます。
「Status」に FIRING と表示され、
「Body」にはアラームの作成時に「アラーム本体」に設定した文字列が表示されます。
また、下側のボタンの「View Alarm in Console」をクリックすると
OCI Webコンソールのアラームの画面を表示できます。
Webコンソールのアラームの画面は次のようになっています。
緑で「OK」 だった表示が 赤で「起動」と表示されていますね。
復旧の通知が来ることの確認
シャットダウンしたサーバを今度は起動してみます。
しばらくすると下記のようなメールが届きます。
Status は OK と表示され、
Body にはアラームの作成時の「アラーム本体」に設定した文字列です。
Type が「FIRING_TO_OK」と表示され、復旧したようなことが分かります。
Webコンソールのアラームの画面は次のようになっています。
緑で「OK」 の表示に戻っており、下側のグラフからは
いつの時間帯が異常状態であったかがわかります。
さいごに
このOCIの「モニタリング」サービスで容易にサーバの死活監視を行うことができました。
CPU使用率などの監視もアラームの定義から行うことができます。
以前はEメールで通知される内容がわかりにくかったのですが、
2021/9/29 のリリース(機能改善)で内容がとても分かり易くなりました!
Friendly formatting now available for alarm messages
https://docs.oracle.com/en-us/iaas/releasenotes/changes/8f8eedf6-99f9-46fc-b273-724b075e99c8/
Services: Monitoring
Release Date: Sept. 29, 2021
You can now apply friendly formatting to email messages triggered by alarms. See example alarm messages as well as instructions for updating your alarms.
無料で使えますし、どんどん使っていこうと思います。