みんな使っている Amazon CloudWatch ですね。
セッション
Amazon CloudWatch
講師:アマゾン ウェブ サービス ジャパン、シニアエバンジェリスト 亀田氏
Amazon CloudWatch 概要
- モニタリングとパフォーマンス管理
- 1ヶ月で800兆を超えるメトリクス監視、2兆を超えるイベントトリガー、50ペタバイトのログ(2018.03時点)
- CLoudWatch Logs : ログを受け止める
- CLoudWatch Logs Insight : ログの可視化、SQL ライクな構文での問い合わせ、クエリのエクスポート可能
- CLoudWatch Metrics : メトリクスが送信される、Logsからも送信される
- CLoudWatch Alarms : メトリクスに応じたアクション
ログとメトリクス収集
- 各環境からリアルタイムでログ収集
- EC2 以外にオンプレも対応
- CloudWatch Agent 利用で、OS 内の情報も取れる
- メモリ内容を可視化したい場合は Agent 利用が必要
- カスタムメトリックスに入る
- メモリ内容を可視化したい場合は Agent 利用が必要
- CloudWatch Metrics
- 70を超えるサービスからメトリクスを自動的に収集
- 時系列データとしてリージョン単位で保存
- Statistic : Sum, Max, Min, Average, Sample Count, Percentile
- しきい値を1度超えただけでアラートを出すと意味のないアラートになりがちなので注意
- リリース直後は短め、安定したら眺めにするなど
- 1分より短い時間の粒度で取得すると課金されるので注意
モニタリング
- ダッシュボードで可視化
- 異常検出機能あり
- ServiceLens : X-Ray と連携してアプリの正常性やパフォーマンス、可用性を可視化して分析
- Synthetics : 模擬モニタリング、ブラウザでのアクセスをテスト
自動実行
- CloudWatch Alarms
- アラームからの自動実行できる
- Lambda, SNS, Chatbot, OS への命令など
- データ欠落時の処理の評価方法の指定可能
- メンテナンスのときなどに利用できる
- 無視するのか異常にするのか?
- M out of N (N個中のM) という指定が可能
- オートスケール
分析
- データ容量と保持期間
- 15ヶ月のメトリクスデータ保存
- Logs は無期限
Insights
- CloudWatch Container Insights
- CloudWatch Lambda Insights
- CloudWatch Contributor Insights
- CloudWatch RDS 監視機能
- これは Insight という名前ではない
所感
CloudWatch は機能盛りだくさんですね。
まずは、ハイパーバイザー層のメトリクス監視から使うのが何も考えなくていいから簡単でしょうか。
オートスケールしたくなると Alarm 機能もちゃんと理解する必要がありそうです。
CDK とかで作るとこのあたり抽象化されて簡単にできる気がします。