メモるだけで精一杯。
セッション
講師:アマゾン ウェブ サービス ジャパン、シニアエバンジェリスト 亀田氏
Announce on 30th
データ駆動型ビジネス
- データドリブンな組織は毎年平均30%以上の成長
- 68%の組織がデータから価値を見いだせないと回答
- データ戦略を策定しているのは28%のみ
「データ駆動しようね」という前置き。
機械学習
- 初期のMLでは試行錯誤が大変でできるだけ学習タスクを手軽に立ち上げることが重要だった
- 現在MLの発展に伴い書学者の学習コストが問題になってきた
- できるだけノーコード/ローコード化することが主眼に
- 過去のアップデート
- Amazon SageMaker Autopilot 2019
- Amazon SageMaker Canvas 2021
- Amazon SageMaker Groud Truth 2019
- アノテーションサービス
- このサービスから直接外注に発注もできる
- Amazon SageMaker Groud Truth Plus 2021
- Amazon SageMaker Studio Notebooks 2021
- Amazon SageMaker Infrastructure Innovation 2021
- Amazon SageMaker Neo 2019
- Amazon SageMaker Data Prallelism / Model Parallelism 2020
- Amazon SageMaker Clarify 2020
- 学習データと特徴量がずれていても推論する
- Deep Profiling for SageMaker Debbugger 2020
- Amazon SageMaker Edge Manager 2020
- 出来上がったモデルをエッジ環境に配置
- Amazon SageMaker Jump Start 2020
- 15+の利用シーン、150+のモデルを OSS で提供
- 転移学習でモデルを育成
- New on Amazon SageMaker 2020
- 今年のアップデート
- SageMaker Role Manager
- ガバナンス強化
- SageMaker Model Cards
- モデルのライフサイクルを通してドキュメントの集中化および標準化を提供
- データサイエンティストがモデルにコメントできる
- モデルのライフサイクルを通してドキュメントの集中化および標準化を提供
- SageMaker Model Dashboard
- 予測動作からの逸脱などに自動アラートやトラブルシューティングを提供
- モデルを統一的に管理
- Geospatial ML with Amazon SageMaker
- 地理空間をサポートし、地理空間データを作ったモデルの構築やトレーニング、デプロイを簡単に
- オープンデータを使うことも自身のデータ持ち込みも可能
- Amazon SageMaker Shadow Testing
- 次期モデルと現モデルとの比較検証を可能に
- Amazon SageMaker AutoPilot Pipeline integration
- Auto Pilot が Pipeline に対応して CI/CD への組み込み可能に
- Auto Pilot : 構造化データに対する Auto ML の実現
- Pipeline : 機械学習専用 CICD パイプラインを管理 (MLOps)
- Auto Pilot が Pipeline に対応して CI/CD への組み込み可能に
- Amazon SageMaker JumpStart Updates
- 自分のアーティファクトを共有できるよう
- Amazon SageMaker Studio Updates
- 自動でバックアップを取って自動でコンテナ環境を作ってくれる
- リアルタイムペアプロ対応
- SageMaker Role Manager
Keynote
- AWS Glue Data Quality
- 品質管理ルールのマネージドサービス
- データを自動的に分析して自動でアップデートしてくれる
- NULL が多いデータを弾いたりできる
- 品質管理ルールのマネージドサービス
- Athena for Apache Spark
- SQL だけではなく Spark で問い合わせできるように
- DocumentDB Elastic Clusters
- パフォーマンスやストレージの自動拡張
- Aurora みたいなストレージになった
with MongoDB
がいつのまにか外れてる
- パフォーマンスやストレージの自動拡張
- Redshift Multi-AZ for RA3
- Redshift が Multi-AZ 対応した
- RA3 インスタンスにてストレージとコンピュートリソースが分離したので Multi-AZ に対応できた
- Redshift が Multi-AZ 対応した
- Redshift Data Sharing
- Redshift auto-copy from S3
- S3 から Redshift へのデータロードを簡素化
- パスを追跡し新しいファイルを自動的に読み込むための継続的な取り組みルールを設定可能に
- PostgreSQL on Aurora and RDS Trusted Language Extentions
- PostgreSQL が持っていた機能が RDS に対応
- 任意の言語で PostgreSQL を拡張できるようになった
- PostgreSQL が持っていた機能が RDS に対応
- Guard Duty RDS Protection
- RDS のログインなどに怪しいのがあると検出
その他
- S3 Access Points Cross account access points
- エイリアス毎にアクセス権設定できるように
- AI Service Cards
- AI サービスを使うお客さんが知っとくといいことの資料集
- Rekognition, Textract, Transcribe からサービス開始
- AppFlow 22 new connectors
- 新しく22のサービス追加
- DataExchange for LakeFormation / S3
- Data をコピーして取得するのではなく、先方が持っているデータにアクセスできるようになる
- マーケットプレイス経由のサービス
昨日時間切れしたその他内容の続き
- FSx for OpenZFS Updates
- パフォーマンス向上
- FSx for NetApp ONTAP Updates
- パフォーマンス向上
- Multi-AZ デプロイが簡単に
- Nitro Enclaves EKS and k8s support
- EKS や k8s の設定が簡単になった
- Redshift Real time data ingresion from Kinesis Data Stream from Amazon MSK
- Redshift Dynamic Data Masking
- 事前ルールに沿ってデータをマスキングしてクエリが戻る
- Key Management Service External Key store
- 外部の鍵管理システムに保存された暗号鍵でデータ保護が可能に
- EC2 I4i Torn Write Prevention
- 書き込み中に落ちてもなくならないように
- Amazon Verified Access
- VPN 不要で企業アプリへの安全なアクセスを実現
- Amazon VPC Lattice
- クロスアカウント、クロスVPC接続、アプリケーション層のロードバランシグを実現
- Kinesis Data firehose / OpenSearch Data delivery
- データストリームの先に OpenSearch が指定可能に
- Contact Lens for Amazon Connect + Call Summarization Chat Support
- 通話終了後にまとめて通話メモを自動作成、チャットに対応した
所感
データ駆動の波に乗り遅れること無く、今年始めれたのが良かった。
おかげで Glue などのアップデートも理解しやすいです。