Datadogでサーバリソースを見れるようにしてみた

学習~監視ツールdatadogについて~

監視ツールのようだ。
wikiによると クラウド時代の監視アプリケーションサービス とのこと。
もしかしたらAWSだけじゃなく、さくらVPSやAzureなどのサーバも一緒に監視できるかもしれない。
というかできた。
複数のAWSアカウントも同時モニタリングできるらしいし、散らばったサーバ群を一か所で監視するのが得意なのかも。
さくらVPSは簡単な監視機能しかなくて監視せず放置していたが、これを使うか?
料金次第では課金しよう。

今回は軽く触ってみるだけ。
エージェントインストールし、ダッシュボードでサーバのロードやらCPU使用率を確認してみるところまで。
datadogがどんなことできるかの詳細についてはググってもらったほうが早い。
https://pages.awscloud.com/rs/112-TZM-766/images/Datadog_0613.pdf

作業記録~アカウント作成、エージェントのインストール、グラフ確認まで~

・エージェントのインストール
https://docs.datadoghq.com/ja/getting_started/agent/

まずはアカウント作成から。(アカウント作成の途中でエージェントもインストールすることになる)
お試し期間は2週間とのこと。
期限くるまでにできる限り理解を深めておきたい。
会社名だのメールアドレスだのを入力していく。

使っているミドルウェアは何か?などの質問に答えていくと、CentOSのインストールコマンドが表示された。
新規に構築したEC2(CentOS7)でコマンドを実行。

DD_AGENT_MAJOR_VERSION=7 DD_API_KEY=******************************** DD_SITE="datadoghq.com" bash -c "$(curl -L https://s3.amazonaws.com/dd-agent/scripts/install_script.sh)"

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 15710  100 15710    0     0  18802      0 --:--:-- --:--:-- --:--:-- 18791
:
================================================================================
 Package               Arch           Version             Repository       Size
================================================================================
Installing:
 datadog-agent         x86_64         1:7.22.0-1          datadog         186 M

Transaction Summary
================================================================================
Install  1 Package
:

これだけでインストールされた、はやっ!

AWSアカウントと連携させることができる模様。
連携させるともっと細かいデータがとれるようだ。
ロールを作成したりCloudFormationでスタックを作成したりしてデータ送付を許可するようだが、セキュリティのことを考え一旦はスキップ。

ダッシュボードを確認すると、データが送られてグラフが作られているのが確認できた。
監視できたリソースをメモしておく。
・CPU usage(%)
・Processes memory usage
・Load Averages1-5-15
・Memory breakdown
・Available Swap
・Disk usage by device(%)
・Disk latency(by device)
・Network traffic(bytes per sec)

・監視対象サーバ追加
さくらVPSサーバ(CentOS7)も同じコマンドを打ち込むだけ。

感想

非常に感度がいい。
10秒ごと?に更新しているのかddコマンドとかでディスク使用率を上げたりサーバに負荷かけたりするとすぐにグラフに反映される。
また、Processes memory usageも、freeがどのくらいとかだけでなく、どのプロセスがくらいメモリを使っているのかも可視化されている。
CloudWatchだと面倒なことしないと監視できなかったSwapだのメモリ使用率、ディスク使用率も標準で監視される。
はっきりいって今のところCloudWatchより完全に上だと感じる。
無料だったら確実に使うレベル。

残件

忘れないように残件をメモしておく。

・閾値を設定し、超えたら通知
・ログ監視設定
・Amazon Aurora MySQLの監視

こんなところか?