QuickSight 勉強中なので気になるとこだけメモ。
セッション
グノシーにおけるデータ分析基盤移行と Amazon QuickSight 導入について
グノシー 楠さん
QuickSight 導入利用
- SaaS 版 Redash を使っていたがサービス終了
- QuickSight 導入へ
Gnunosy の データ基盤
- Data Source : RDS, DynamoDB
- embulk で Data Lake へ
- Data Lake : S3, Glue Data Catalog, Lake Formation
- Athena で BI へ
- BI : Redash
Gunosy におけるデータ分析
- Redash が2021/11/30で終了
- 利用用途は大きく2つ
QuickSight 導入
- コスト面で優位と判断
- セッション課金なので利用しなければ安い
- Editor /Reader アカウント切り分け可能
- AWS サービスである
- ダッシュボードクエリ書き直し
- Athena View 利用、Athena に登録できる集計処理
- 実態データない、ロジック共通化、低コスト
- Athena View 利用、Athena に登録できる集計処理
- Lambda で共有設定、権限管理自動化
- QuickSight の分析/ダッシュボードなどの作成はユーザー単位
- QuickSight イベントで発火する Lambda で SQ のグループ利用して共有
- QuickSight の分析/ダッシュボードなどの作成はユーザー単位
今夜、Serverlessくらべてみました
NTTデータ 野口さん
- レイクハウスアーキテクチャ
- データレイク+ DWH のアーキテクチャ
- Redshift + S3 や Lake Formation
- データレイク+ DWH のアーキテクチャ
- Redshift Serverless vs Athena
- DWH としては Redshift
- ◎:PostgreSQL ベース
- ◎:Materaized View 対応
- ◎:RESULT CACHE機能あり
- ○:LOAD, DMS で実行
- ○:Federated query : Redshit, RDS, S3
- Athena は対応データ豊富、取り込み容易
- DWH としては Redshift
Amazon Athena Federated Query コネクター紹介
AWS 林田さん 藤沢さん
- スキャンしたデータ量に対しての課金、サーバーレス
- 圧縮していれば圧縮した容量で計算
- Lake Formation 新機能サポート
- カラム/行/データベース/テーブルでの権限管理
- Governed Tables によって、ACID トランザクション可能
- Athena Federated query
- S3 以外もクエリできる
- クロスアカウントも対応
所感
QuickSight 難しい...
Glue Data Catalog はある程度できるようになって、Athena で見る分には困らなくなってきたけど、QuickSight で思った通りの表示にするのはまだまだ難しいです。
この当たりは取り上げてもらえなかったので、ビジュアライズを上手にするにはどうやって勉強したらいいんだろう?