omuronの備忘録

個人的な備忘録

「JAWS-UG SRE支部 #6」 #jawsug_sre 受講メモ

jawsug-sre.connpass.com

アイスブレイク LT いいですね。
登壇はハードルなかなか高いけど得るものは大きいです。

セッション

「エンジニアリングで運用を改善する」ためのAmazon CloudWatch活用

アマゾンウェブサービスジャパン合同会社 津郷 光明さん

speakerdeck.com

  • SRE は DevOps の一つのやり方
    • SRE はサービスの信頼性、品質に責任を持つ
  • モニタリング・オブザーバビリティ
    • 自動化や運用を改善する上で重要
    • インフラだけではなくアプリケーションレイヤーもモニタリングするのが大事
  • CloudWatch でサービスを統合的にモニタリング
    • 19の機能
    • インフラだけではなくアプリケーションもモニタリングする機能がある
  • スコープを切ってモニタリングし、品質・信頼性を積み上げる
    • 正常性確認のモニタリング
      • CloudWatch Synthetics : 外形監視機能
      • CloudWatch ServiceLens : X-Ray 連携してサービス間の依存関係やレイテンシ、レスポンス状態について視覚的に把握
      • CloudWatch Internet Monitor : 通信経路のモニタリング、特定の地域(ラスベガスとか)からのパフォーマンスが悪いとかわかる
    • ユーザー視点でのレイテンシー、エラー
      • CloudWatch RUM : クライント側のパフォーマンス把握
    • 一歩踏み込んだ品質・信頼性の確認、分析
      • CloudWatch Insights と Metric Math : 特定ユーザーのみエラーとかを見つけ出す
      • CloudWatch Logs メトリクスフィルタ と Metric Math : 正常レスポンスのうちレイテンシーが大きいものを抽出

AWSエンジニアに捧ぐ、CloudWatch 設計・運用 虎の巻

アライさんとウマカツさん

speakerdeck.com

  • ビルディング思想でサービスを強化していくとシステムが複雑化して分散化していく
    • SRE は信頼性維持と運用改善が必要
    • オブザーバビリティはいつどこでなにがおこっているのか把握できる能力と状態
  • CloudWatch メトリクス
    • データポイントの保持期間は保存間隔によって間引きされる
    • 15ヶ月以上保持する場合は Metric Streams で保存
      • お金がかかるので適切にフィルタした方がいい
    • 15ヶ月以上で消える、自分で消せない
  • CloudWatch Metrics Insights
    • 直近3時間まで
  • CloudWatch Logs
  • CloudWatch Container Insights
    • ECS on EC2 なら EC2 側にエージェントなどが必要だったり EKS や Fargate で設定が違うので注意
    • カスタムメトリクス自動作成で追加コストが増えていくので注意、開発環境では消したりする
  • X-Ray
    • VPC の外にあるサービス
    • サンプリング抽出なので注意、サンプリング数は調整可能だが料金に跳ね返る

Amazon CloudWatch Syntheticsで始める外形監視

SREホールディングス 釜田 康平さん

  • WordPress メンテ後に社内からのアクセスは問題がなかったがユーザーからはエラーになった
    • CloudFront のリダイレクト優先順位ミス
    • 監視はしていたがユーザー目線での監視がなかった
  • CloudWatch Synthetics
    • Canary 作成で簡単に外形監視できる
    • Lambda 上の Node.js や Python などで簡単に実装

CloudWatchでバレる「君、仕事中にyo〇tube観てたよね?」

クラウドセントリック 角中 源太郎さん

  • CloudWatch Agent をローカルに入れれば監視できるのでは?
    • SSM Agent を PC に入れてセットアップ
      • メトリクス見れるようになった
      • Chrome のブラウザ履歴も見れた
        • SQ Lite 形式で情報分析できた

CloudWatch複合アラームでELBの5XXをいい感じに検知しようとしたらうまくいかなかった話

k.gotoさん

speakerdeck.com

  • HTTPCode_ELB_500|502|503|504_Count と HTTPCode_ELB_5XX_Count の重複通知をしなようにしたい
    • CloudWatch 複合アラームで対応したけど 503 アラートで両方とも発火して重複して通知された
    • サプレッサーアラームで対応して、重複排除できた

CloudWatchを個人情報保護の盲点にしないために

株式会社キャンサースキャン 保坂 将平さん

  • CloudWatch Logs に機密情報が無いと言い切れるか?
    • データは単年度で削除するのが要件で監査証跡など必要なログは残す
    • data protection は日本語非対応
    • subscription filter でマスクする
    • S3 に転送した後に好きに加工

所感

オフラインが復活してもオンライン配信もしてくれるのは助かります!
プレゼントや懇親会など現地は楽しそうで羨ましい!!