omuronの備忘録

個人的な備忘録

「クラメソおおさか IT 勉強会 Midosuji Tech #2」 #midosuji_tech に参加しました

クラメソおおさか IT 勉強会 Midosuji Tech #2 #midosuji_tech

クラメソおおさか IT 勉強会 Midosuji Tech #2 #midosuji_tech - connpass

セッション

LT1「ブラウザ上で実行され、AIアシスタント付きデータベース postgres.new を触ってみた」

西田将幸 さん

  • Supabaseが作ったブラウザで実行されるAIアシスタント付きPostgreSQL
    • スキーマの自動生成
    • 自然言語でクエリ、グラフ作成、データ投入できる
      • 生成されたSQLの確認もできる
      • 「売上トップ3だして」とかでグラフ作成
      • 「サンプルデータ追加して」とかできる
    • https://postgres.new/ でプレイグラウンドある
    • csvスキーマ生成
      • 複数csvの関連を推測
    • gpt-4o-2024-08-06が使われている

これPoCにめっちゃ使えるんじゃね?
あとはBIツールやエクセル使わなくても楽にグラフ作れたりしそう。

LT2「GenU導入でCDKに初挑戦し、悪戦苦闘した話」

長田英幸 さん

cdk bootstrap とかCDK的お作法に慣れてないと確かに最初は大変かも。

LT3「これから始めるNutanix Cloud Clusters on AWS

arapさん

ベアメタルインスタンスも止めると課金対象外になるんだ。
止めて節約もできると。

LT4「IoT Greengrassの横文字を理解しながらセットアップしてみた」

よなみね さん

  • IoT Greengrass:IoTのソフトウェアの管理を楽にするサービス

スライド可愛くてわかりやすかった...がいかんせんIoTを自分がやることはなさそう。

LT5「Bedrockを使用したサーバー構築」

くまたろ さん

  • Claude 3 に構成図をアップロードしてTerraform作成の指示を出す
    • AMIやSGなど細かいことはプロンプトに記載
  • Terraformの実行についてもプロンプトで生成させる
  • CloudShellでTerraform実行
    • 続きの作業もプロンプトで聞く

生成AI使うと
「俺達は雰囲気でプログラムを書いている」
を概ね実現できるのがすごいよね。

LT6「素敵なWebフレームワークHonoを紹介したい」

神野 雄大 さん

  • 高速軽量なTypeScriptフレームワークのHono
    • 4行でWebサーバ起動できるシンプルさ
    • ログや認証周り、バリデーションチェックなども準備
    • エラーハンドリング周りを一括で準備できる
    • バックエンドとフロントエンドの統一を容易にするRPC機能
      • フロントエンドとバックエンドで型保管できる
    • バックエンドでOpenAPI定義書を生成するとモックサーバーを自動で作成可能

Hono流行ってますね。
インフラをCDKで書いたら、フロントエンドからバックエンドまですべてTypeScriptで完結できてしまう。
軽量な分、利用するのにセンスが問われる。

LT7「Google CloudのLLM活用の選択肢を広げるVertex AIのパートナーモデル」

nayu.t.s さん

  • Vertex AI:フルマネージド統合 AI 開発プラットフォーム
    • Gemini以外のパートナーモデルも利用できる
    • BigQuery MLからも利用できる
      • SQLからLLM(GeminiやClaude)にプロンプトを投げれる

Google Cloud版Bedrockと理解した。

「Amazon CloudWatch入門&LT会 みのるんのゲリラ勉強会&インフラ技術基礎勉強会コラボ」 #cw_osarai 受講メモ

Amazon CloudWatch入門&LT会 みのるんのゲリラ勉強会&インフラ技術基礎勉強会コラボ

infra365.connpass.com

セッション

オンプレミス市監視村の人達と学ぶCloudWatch基礎

久保田亨さん

  • AWS のサービスを起動すると CloudWatch に自動でメトリクスが表示される
  • CloudWatch による EC2 の監視
    • 無料の基本モニタリング、5分間隔
    • 有料の詳細モニタリング、1分間隔
    • 有料のカスタムメトリックス、CW Agentインストール必要
      • メモリなどのサーバ内部情報必要なら必須
  • CloudWatch Insights で特定のログを検索
    • CloudWatch の VPC ログでENI毎の通信量を取るとか
  • メトリクスフィルター
    • CW Agent を EC2 に入れて特定のエラーを CW Logs に送ってメトリクスフィルターで閾値を指定して検知することができる
  • サブスクリプションフィルター
    • CW Agent を EC2 に入れて特定のログを次の処理に渡せる
      • SNSに渡せないので、メール通知とかするならLambdaに投げるなど
  • CloudWatch Alarm
    • アラーム/OK/データ不足の状態変化を取って通知できる

当たり前にあるけど機能が多くて把握が難しいCloudWatch。 必須機能だけどログを貯めまくると結構お金がかかったりする点は注意ですね。

多すぎる!!気づくと増えてるAmazon CloudWatch大家族、クラウド初心者にも分かりやすく整理しました

みのるんさん

speakerdeck.com

  • CloudWatch には現在20以上の機能がある
    • マネジメントコンソールの左側のサイドバーみるとわかる
    • セクションだけでも8つある
    • CWとは基本的にメトリクスリポジトリ
  • 定番セット
    • メトリクス
    • ログ
      • 異常をログ記録:AI使って異常を検知
      • ログのインサイト:専用クエリでログ検索
      • Contributor Insights:影響が大きい悪いやつのN件自動で表示
    • アラーム
  • APM
    • X-Rayトレース:昨年CWに統合された
    • Application Signals:アプリを自動計測して可視化
      • OpenTelemetryを自動で計測
      • DEM3兄弟:Cynthetics, RUM, Evidently(A/Bテスト機能)
        • Frontend監視用
  • ネットワーク
    • インターネットモニタリング
  • 深堀り

量が多いCloudWatchを神まとめしてくれて素晴らしい。 初心者にまず見せたい資料になりそう。

CloudWatch Application Signals と APM の入門!

木村健人さん

  • APM tools on AWS
  • CloudWatch Application Signals
    • X-RayやADOTを組み込んで、自動計測エージェントがアプリケーションを監視するソリューション
    • Goだと手動でSDK使って組み込み必要、Javaだとアプリコードに変更加えずに組み込める

マイクロサービスの監視にはこういう分散トレーシングは必須。

CloudWatch Logs Insightsで定期業務をスマートに

こまきちさん

  • CloudWatch Logs Insightsで検索
    • 対象のリクエストがわかってログにも飛べる
    • ログ設計を意識すると検索が楽になる
      • [INFO] つけるとか
      • Lambdaなら "Powertools for AWS Lambda" が便利
    • クエリの保存やダッシュボードにもできる

CloudWatch Logs Insightsは独自の検索文が辛いんだけど、Amazon Qで書いてもらうことができるらしい。 早くアマQも日本語化してほしい。

「DevelopersIO 2024 OSAKA」 #devio2024 に参加しました

【7/31(水)】DevelopersIO 2024 OSAKA #devio2024

classmethod.connpass.com

大阪でのリアル開催ありがたい!

セッション

レビューに向けて一工夫しませんか、というお話

高崎さん

  • LineミニアプリはWebアプリなので脆弱性対策やライブラリのアップデートなど対応が必要
    • ドキュメントとソースだけなので要件や背景を残すことを考えた
    • レビューでADRを残すことにした
  • ADR確認内容
    • 整理内容のチェック
    • 方針や検討の是非
    • 調査内容の是非
    • コストの確認
    • 実装漏れの確認
  • レビューはレビューアーの振り返り
    • KPTのKはどうすべきか?->褒めましょう

「褒めましょう」コレ大事。
コードの向こうには人がいる。

はじめてのレコメンド〜Amazon Personalizeを使った推薦システム超超超入門〜

貞松さん

speakerdeck.com

  • レコメンデーション導入にはハードルが高い
  • レコメンデーションの特徴
    • 検索と近い、暗黙的な過去の履歴から検索して提案する
    • 利用者メリット:目的のものに素早くアクセスしたり、ユーザーが意図しない気づきを与える
    • 事業側メリット:サービス利用の継続、売上向上、新規アイテムを適切にユーザーに届ける
  • Personalizeの構成要素
    • データセット(必須):Interaction
      • USER_ID, ITEM_ID, TIMESTAMP が必須
      • 誰が何をいつ買ったか?というデータが有ればレコメンドできる
      • 最低1,000件あればレコメンド可能
    • データセット(任意):
      • USER:属性(年齢、性別)など
      • ITEM
    • ソリューションの作成
      • ソリューション:レシピやハイパーパラメータでモデルを学習する枠組み
      • ソリューションバージョン:学習の各バージョン
    • レコメンド作成
      • キャンペーン(リアルタイムレコメンド)
        • APIエンドポイントにUSER_IDとITEM_IDなどなげてレコメンド結果を取得
      • バッチレコメンデーション
        • JSONで必要データを準備してバッチでまとめて作ってS3に保存
    • 利用可能なレシピ
      • ユーザーベース:あなたへのオススメ
      • アイテムベース:この商品を買った人へのオススメ

学習データの数の準備は必要ですが、「誰が何をいつ」のデータだけあれば推論できるので、試すハードルは低いですね。
もともとにーのさんのプレゼン予定が体調不良により貞松さんに変わったのに、同じ内容でプレゼン準備したのすごい。

AWS IAM Identity Center を使わないマルチアカウント環境の IAM ユーザー管理

yhanaさん

speakerdeck.com

IAMユーザーのパスとCondition使ったワイルドカード方式はしらんかった。
IDプロバイダー経由でもスイッチロールできるのも知りませんでした。 これの設定はちょっとややこしそう。

AWS CLIシェルスクリプト、いつ使う?活用できる場面とTips紹介

川原さん

speakerdeck.com

シェルスクリプトで処理するならシェル芸のお勉強しておくと非常に役に立つ。
昔と違ってLLMに質問すると簡単にシェル芸できるようになったのもいいところ。

IoTデータのデータレイクにTimestreamとS3を比べてみた

与那嶺さん

speakerdeck.com

データレイクにAthenaとTimestream使った場合の1分単位のクエリコストが500倍ぐらいTimestreamがたかった。
TimestreamはIoTで使いやすいとはいえ、かなりコストかかるんですね。

詳解 AWS Lambdaコールドスタート(ダイジェスト版)

岩田さん

dev.classmethod.jp

  • 一つの仮想マシン(Fireclacker micro vm)のうえにLambdaのサンドボックスも一つ
    • フルコールドスタート(vmから起動)とパーシャルコードスタートがあるがユーザーからはわからない
  • Lambdaのベストプラクティス
    • 遅延実行なしにするならhandlerの外でboto3クライントを生成
    • 遅延実行ありにするならhandlerの中でboto3クライントが生成されてなければ生成
      • InitフェーズをInvokeフェーズへ移動する
      • boost host CPU機能:InitフェーズではCPU割当が最大10秒間までブーストする
        • Invokeが重くなるので、遅延実行なしのほうがInitフェーズで重い処理するため早いケースも起きる
  • Node.jsの場合
    • v20以降であれば、Root CAを全部読まないので必要な証明書だけ読み込ませると早くなる
  • Pythonの場合
    • botocoreから不要なライブラリを消す

すごい知見の資料でした。
botocoreから不要なライブラリを消すなどの黒魔術はすごいけどやりたくないやつだ。

そのデータ、すぐに復旧できますか? 〜 FSx for ONTAP で実現するランサムウェア対策

藤原さん

  • NetApp:ネットワーク越しにNASを使えるところからスタート
    • 地球上で最もセキュアなストレージ
  • ランサムウェア
    • サービスとしてビジネス化されていることもあり増えている
    • 46%は調査復旧に1,000万円以上かかっている
    • 81.1%はバックアップから復旧ができていない
  • Ceyber Security:防御力
    • IDENTITY/識別, PROTECT/防御
  • Ceyber Resilience:復元力
    • DETECT/検知, RESPOND/対応, RECOVER/復旧
  • on tap = (ビールとかの樽についてる)注ぎ口
    • すぐに出せるようになっている
    • ここから ONTAP という名前を取ってるためプロダクト名はビールの銘柄

メモってはないのですが、ストレージ上でマネージドなONTAPならではの機能がたくさんあるんですね。
ランサムウェア対策を楽にちゃんとするなら使う選択肢になりそう。

edrockの宇宙最速アウトプットしまくってたら書籍出版できた話

みのるんさん、森田さん

speakerdeck.com

裏話めっちゃ面白かった。
みんなほぼ休み無しで書きながら、Qiitaランキングも維持して、担当の人すら休んでるのに続けて校了まで続けるパワーがすごすぎる。 一昨日Cloud9が急に使えなくなる事件も面白いし、徹夜とかで代替案だして対応しているのも素晴らしい。

データ品質管理の第一歩

鈴木那由他さん

  • データ品質とは
    • データが目的を満たすために備えるべき特性を定義したもので、データの状態(質)を表したもの
    • 正確性、完全性、一貫性、信頼性、再申請、アクセスビリティ...など15項目
    • 大きく2つに分けれる
      • 基礎的品質特性(正確性、完全性、一貫性)
      • 付加的品質特性(基礎意外)
    • データ提供者が品質管理をする
  • データ品質ルールの設計
    • 組織全体を念頭にいれる
      • 守らないとデータがもらえなかったりバラバラになったり
  • データ品質チェック
    • Glue Data Qualityで対応できる

良いデータ分析をするためには良いデータ品質から!
ISOでデータ品質の項目が定義されてたんだ。

TerraformでAWSのIaCを始める・始めたばかりの人へ

かずえさん

Terraformの発音は"テ"の部分があがるらしい。
Terraform便利なのはわかるのですが、CloudFormationよりCDKが流行っているように、TerraformもCDKTF使ったほうがよかったりしないのかな?

今時のCookie事情

西田さん

  • Cookieの属性
    • Path属性:Cookieの送信するパスを指定できる、そのパス配下しか送れないようにできる
    • Domain属性:Cookieが送信されるドメインを指定、何も指定しない場合そのドメインしか送られない
    • httponly属性:JSからアクセスできないようにする
    • Secure属性:httpsのみで送信される
  • CSRF(シーサーフ):Cookieが自動で送信される仕組みを利用した攻撃
    • CSRFを防ぐには
      • CSRFトークン:正規サイトでランダムなトークンを発行してformに保持
      • Same Origin Policy:異なるオリジンからのリクエストを拒否する
        • これをゆるめるのが CORS という仕組み
          • アクセスできるオリジンを指定
      • Same Site:同一サイト外へのCookie送信を制限、サブドメインのみ異なるのが samesite
        • Lax:GETリクエスト以外のクロスサイトリクエスト(3rd Party Cookie)を拒否
        • Strict:全てのクロスサイトリクエストを拒否
        • None:全てのクロスサイトリクエストを許可
    • API側でCSRFを防ぐには
      • 副作用のあるGetAPIを作らない
      • HostとOriginヘッダが同じかチェック
  • 3rd Party Cookie:サイトをまたいで送られるCookie

Webエンジニアやってるとある程度当たり前に覚えておくことが求められる部分。
基本的な内容だけどちゃんと理解できてない部分もあったのでいい勉強になりました。

Amazon Q in QuickSightで実現する次世代のデータ分析 - 生成AIがもたらすBIの革新

溝渕さん

  • Amazon Q in QuickSight
    • Generative BI 機能
    • ビジネスユーザー向け
      • エグゼクティブ・サマリー
        • ダッシュボードの内容のサマリーを作ってくれる
      • Data Q&A
      • データストーリー

Amazon Q in QuickSightには夢がある。
BIツール使いこなすのは学習コスト高いから、はやく日本語化して欲しい。

MWAA を使用したGlue JOBのオーケストレーション

久保さん

  • MWAA:Managed Workflow for Apache Airflow
    • Apache Airflow のマネージドサービス
    • Pythonで複雑なワークフロー書ける
    • いつでもどこからでも再実行
    • AWS以外から連携できる
      • Google CloudやSnwoflakeと連携とか
    • Glue Jobを呼び出すモジュールがあるので、PythonGlueJobOperator をimportすれば使える

SFn使うのがしんどいからGlue Workflow使って簡易的なワークフロー作ったりもするけど、MWAAのほうがよかったりするんだろうか?
Pythonがかければワークフローが作れるというのが大きなメリットか?

エッジコンピューティングだけで何処までの処理ができるのか?パブリッククラウドは不要になるのか?〜Cloudflareのエッジコンピューティングの今〜

亀田さん

  • マイクロサービスアーキテクチャはあうあわないがある
    • スタートアップなどではリソースが限られてるからモノリシックなほうがあってたり
  • CDは2種類ある
    • 継続的デリバリー:最後本番は手動、赤信号を入れておく
    • 継続的デプロイメント:全自動
  • Cloudflare global SASE network
    • L1-7まですべてのレイヤーでセキュリティを提供
    • Cloudflareの特徴として復路もWAFを通す
  • 最大60秒の結果整合性
    • すべてのデータセンター500個にコピーされるのに最大60秒かかる
    • この特性を理解してパブリッククラウドと使い分けが必要
  • Workers と Lambdaとの違い
    • コールドスタートが無い
    • Region / VPC 存在しない
    • Node.js のサポートが限定的
    • Cloudflare Workers は Service Worker + Web Worker で動作
      • CDNの中で動くので専用のエンドポイントがない

パブリッククラウドを置き換えるものではないけど、とても尖っているサービスなので使いこなせるようになりたい。

「 Bedrock Night in 大阪(JAWS-UG AI/ML×大阪×東京支部コラボ)」 #jawsug_aiml 参加メモ

Bedrock Night in 大阪(JAWS-UG AI/ML×大阪×東京支部コラボ)

jawsug-ai.connpass.com

セッション

AWSの生成AIサービス「Amazon Bedrock」入門

みのるんさん

speakerdeck.com

Bedrockのイチオシ機能「ナレッジベース」と「エージェント」と。
まだプレビューだけど今後は Prompt flow とかもオススメになりそう。 Cloud9 が使えなくなったので代替手段を徹夜ですぐ作ったと。

LT① セキュリティ検出結果をBedrockで読みやすくしてみた

塚田 真規 (三菱電機株式会社)

speakerdeck.com

  • 実際に触れてアウトプットしていくのがいい
    • AWSサンドボックスを提供して試してもらう
    • セキュリティ意識も高めてもらう
      • Security Hub, Config, GuardDuty を入れてチェックしてもらう
  • Security Hubのセキュリティ結果をテキストで出して理解してもらう
    • Security Hub 野結果を Bedrock で要約して S3 に保存する SFn を作成
      • Agents for Bedrock をつかって、不足情報はLambda経由でWebから取得する
      • Prompt flows が発表されたのでそちらでも試してみた
    • Security Hub の内容が初心者にもわかりやすい出力になった

Security Hubの内容はそのままだとわかりにくいから、Bedrockを使ってわかりやすくした事例でした。
やっぱり、SFnで作った機能をPrompt flows で置き換えできるのね。
SFn つらいから Prompt flows のほうがマシになるか?
ただ、最終的に IaC に落とすのはどっち使っても大変そう

LT② Amazon BedrockとOpenSearch Serviceで、何でも答えられる社内RAGを作成する!!

とすりさん

  • 新卒が社内資料を見つけられない問題を解決するのにRAGを作った
    • Claude 3.5 Sonnet(回答) + Titan Text Embedding v2(ベクトル生成) + OpenSearch Service + S3
    • チャンク分割を工夫
      • 固定長、句読点などはよく使われる
      • 今回はMarkdownに変換してH1やH2タグごとに分割
    • Citations:LLMが参考にした内容のみを返すプロンプトエンジニアリング
      • Tool use(Function Calling) を使用して実装

「ナレッジベースを使えば別途作らなくてもいいでは?」と思っていたけど、チャンク分割とかTool useで精度向上したりするために、個別で作って実装しているのか。
後でXで聞いたところ、ナレッジベースそのままだとOpenSearch Serviceが高いのも理由と。

LT③ AWSの生成AI活用事例集GenUを使い倒す

こまきちさん

speakerdeck.com

GenUは社内とかのPoC向けには非常に有効と思ってる。

LT④ 図面中の風船番号の読み取りについて。Amazon RekognitionとClaude 3.5 Sonnetの画像認識の検証

長田英幸さん

  • パーツリストの風船番号にリンクをつけるためOCR使ってXMLで座標を作成
    • セキュリティ的に国内にデータをとどめたい
    • Claude 3 だと文字は見れても位置は取れない
      • 文字の位置のバウンディングボックスを取りたくてプロンプトエンジニアリングしたけど無理だった
    • Rekognition で OCR 的に風船番号の位置は取れる
      • Textract で文字を読み取りたいが東京リージョンにないので使えない

実際の業務のDXとして試した内容を聞けるの貴重。
生成AIが万能で唯一の答えじゃなく、やりたいことにあったサービスを選ぶのが大事。

LT⑤ PoCの先へ。社会実装 with 生成AI in CyberAgent.

小西 宏樹さん

  • 生成AIは今後動画を作ったりなどできることが増えていく
    • 経済的ポテンシャルが高い
  • 実際のPoCは RAG bot ばかり
    • 理想の活用は bot
      • ドラえもんのような何でも良しなにやってくれる何かが理想では?
  • PoC はお金を生み出してない、業務フローに組み込まれてない
    • AWSもモデルは外部なのでそこまでお金を生み出してない
  • 営業向け生成AI利用例
    • 営業資料の作成が大変
    • 営業資料の枠組みは決まっているので生成AIを使って自動化
      • 課題分析エージェント、広告提案エージェント、類似調査エージェントをマルチエージェントで実現
      • Lambdaに LangChain 乗せて OpenAI/Gemini 使ってマルチエージェントを実装
        • Bedrockはマルチエージェントに対応してないため外部LLM利用
    • 業務フローに組み込んで実際に工数が減るかを考える
      • ここが大事

生成AI使えば、PoCはすぐにできるのですが、そこでお金を生む(節約できる)ところまで進めるのが難しいですよね。
業務フローに組み込んでちゃんと利用することまで考える必要があると。

Bedrockでおもしろ画像生成!大喜利大会

山下さんと愉快なBedrockers

ここではかけないけどAWSをイメージした画像が面白かった。
有償はやまださんでした。

面白い画像作るには「マッスル」といれるとムキムキ男性出ていい感じになるらしいです。

「BigData-JAWS 勉強会#27」 #bdjaws 受講メモ

BigData-JAWS 勉強会 #27 #bdjaws

jawsug-bigdata.connpass.com

セッション

LT① 【【Bedrock×Athena】生成系AIを活用したSlackデータの分析に挑戦

荒牧 慧さん

  • Slack AI が GA
    • 休み明けSlack貯まる問題のサマリーだしてくれるのでは?
    • 1,200円と高い...
    • 使わずに Bedrock x Athena で実装
  • AWSアーキテクチャ
    • 収集用 Lambda で Slack からデータ取得して S3 へ
    • 推論用 Lambda で Bedrock

LLMの使い方でサマリーや要約は比較的ハルシネーション起きなくいい感じの答えくれるので、ユースケースとしては実現しやすい内容ですね。

LT② IoT Core と Data Firehose によるデータ連携で直面した課題

井川 朋樹さん

Firehose作成時に設定できる「動的パーティショニング」で処理する必要があったが「S3プレフィックスタイムゾーン」設定が増えたと。
UTCだけだったがバケットプレフィックスタイムゾーンも指定できるようになったよと。

LT③ Athena Partiton Projectionを調べてみた!

水村 健太さん

speakerdeck.com

  • Athena のよくあるパーティション管理
    • Glue Crawler で定期的にバケット全体をスキャンして更新
      • 時間かかる、実行時間に対してお金がかかる
    • ALTER TABLE ADD PARTITION 文を定期実行
  • Athena Partition Projection
    • パーティション管理を自動化してくれるAthenaの機能
      • CRATE EXTERNAL TABLE 文の TBLPROPERTIES で設定
      • Glue コンソールからテーブル編集ページで Table properties でキーバリュー設定
    • 予測可能なパーティションパターンの場合
      • integer, date, enum
    • 予測不可能なパーティションパターンの場合
      • 挿入型(injected型)で設定
        • クエリ時には WHEREパーティション指定が必須になる
        • 値はデータを読み取らなくても評価できるリテラルまたは式である必要がある
    • インメモリ処理で高速化される

Glue Crawler 便利だけど定期実行させないとだめで、だんだん辛くなるので Partition Projection に寄せれるときは寄せるほうがいいかと。

LT④ データ初心者がAWS GlueでPII対策やってみた

佐藤 亨さん

  • PII≒個人情報
  • Glue DataBrew で個人情報保護できるのでは?
    • DataBrew の PII マスキング機能
      • 日本語はマスクされない
        • メールはマスキングされるのに氏名はされない

Glue DataBrew の PII マスキング機能は英語(US)用のなので日本語では使えないと。
列を指定するなら使えそうと。

LT⑤ AWS Glue for Ray の普及にささやかで微力な貢献を

坂口 拓生(株式会社エーピーコミュニケーションズ)

  • Glue の ETL
    • Glue for Apache Spark:マルチノード分散処理、Spark学習コスト高め
    • Glue for Python Shell:シングルノード処理
    • Glue for Ray:シングルノード処理、学習コスト低め
  • Ray:PythonアプリをスケーリングするためのOSS統合フレームワーク
    • Ray Core:Pure Python コードを分散アプリとしてビルド、スケーリングする機能の提供
    • Ray Data:Ray アプリにおける分散処理のためのAPI
  • pipray をインストールしても使える
    • Cloud9は Glue の Ray とバージョン違うので注意

Glue Jobs は Spark と Python Shell は触った事あるけど、Ray は知りませんでした。
ただ、日本語も含めてドキュメントが少ないのがネックと。

LT⑥ 大規模な通信制御信号処理の環境下におけるAthenaのパフォーマンス比較

小澤 遼さん

  • 500万レコード vs 8,500万レコードの LEFT OUTER JOIN 比較
    • S3 Standard 利用であれば 10-128MBでの分割ファイルが早い
    • S3 Express One Zone 利用であれば 1-128MBでの分割ファイルが早い
      • 小さいファイルの処理向け
    • 公式サイトでは128MBで分割が推奨されているので小さければ良いというものではない
    • 128MB以下ならファイル差(csv, csv.gz, parquet(snappy), parquet(gz))はあまりない

ログとかは細かく分割されるケースもあるのでそういうときに前処理したくない場合は S3 Express One Zone 使えば良さそう。

「JAWS-UG東京 ランチタイムLT会 #13 アニバーサリー企画!」 #jawsug_tokyo 受講メモ

JAWS-UG東京 ランチタイムLT会 #13 アニバーサリー企画!

jawsug.connpass.com

セッション

祝!ランチLT会 1周年記念 〜お楽しみ企画〜

  • 平均167人応募
  • LT倍率低い日もあるよ、平均2倍程度
    • 運営も出れるし普通に落ちる

裏話おもしろい。 すごい人気なLT会ですね。

LT① 規制対象のワークロードでセキュアにGenAI を活用する際のハシゴの紹介

heiyooさん

LLMでのセキュリティ考えるの大変だけど、AWSしか使ってなければまだなんとかできそうなところが助かります。

LT② SSM PatchManagerでマルチカウントでのパッチ運用をしたい

mogroさん

  • Organizationsの管理アカウントからEC2へパッチを当てたい
  • SSM の機能で実現
    • EC2をSSM Patch Managerのノードとして管理
    • EC2からパッチリポジトリに接続できることを確認
    • Private Subnet から SSM にアクセスできるように VPC Endpoint 設定
    • 対応OSなことを確認
    • ターゲットを設定

ちゃんと全部に当たるかパターン検証が大変そうなお話。 とはいえ、手動でやるよりかは全然楽ですよね。 昔だとAnsibleでやったりとか。

LT③ 5分でまとめたいWell-Architected Framework アップデート

かわごえさん

  • 全部準拠しなくてもいい
    • 全部読まなくても必要なところからでいい
  • 実装したいときはGitHubでサンプル探すと大体ある

「ビビるぐらいスッと入ってこない日本語」と。
AWSはドキュメントしっかりあるけど量も多いし難しいのでつまみ食いしながら必要に応じて理解するしかないと思ってます。
最近 Amazon Q 利用を勧める内容も増えたらしいです。

「JAWS-UG朝会 #59」 #jawsug_asa 受講メモ

JAWS-UG朝会 #59

jawsug-asa.connpass.com

今日はいつもの小倉さんじゃなくて、はしもとさんの司会進行でした。
ちょっと新鮮。

セッション

セッション① AWS IAMのアンチパターン/AWSが考える最低権限実現へのアプローチ概略〜AWS IAM Identity Centerの権限設計も考えてみる〜

NRIネットコム株式会社 丹勇人さん

  • IAMアンチパターン
    • 長期的な認証情報、アクセスキー更新されない
    • MFA使わない
    • ルートユーザー保護のベストプラクティスに従わない
    • 最小権限ではない、AWS管理ポリシー使わない
    • 未使用のユーザーやロール、ポリシーなどを棚卸ししてない
    • IAM Access Analyzer を使わない
  • 最小権限実現
    • 必要最小限の権限エリア把握
    • 受容できないビジネス影響の洗い出し
    • 受容できないビジネス影響の権限範囲の把握
    • 受容できないビジネス影響の統制メカニズムを選定
      • Control Tower つかったり、カードレール考えたり
  • IAM IdC 利用
    • 権限セットのクォータ上限がデフォルト250
      • メンバーアカウントに委任して減らす

IAMの理想はある程度理解しているつもりだけど、実際に理想通りに運用するのはかなり大変です。

セッション② マルチアカウント下でも安全かつ自由にSSO権限を設定するためにやったこと

澤井駆さん

  • マルチアカウント下でのアクセス管理
    • IAMユーザー:複数アカウントあると大変
    • SSO:オススメ、1度の認証で複数アカウントにサインイン可能
      • IAM IdC:最小権限の原則のためには自ら許可セットを編集するのが不可欠だが、ユーザーが自ら許可セットを編集できない問題がある
        • Webフォームで申請すると自動で反映するシステムを構築

IAM IdC の許可セットを作るのは負担だなと思ってたのですが、ユーザーが申請して更新する仕組みで解決しているのは素晴らしい。

LT① Direct Connectを実際に触ってみた

BTC 宇都宮さん

公共系でDirect Connect使ったときのお話でした。
情シスとかじゃないと触ることは難しいDirect Connectなので、今後も触る日は訪れるんだろうか?

LT② 公共領域から学ぶ クラウド移行についてエンジニアが意識していること

NTTデータ 川村吏さん

デジタル庁がだしているクラウドに関する国の方針が役に立つというお話。
クラウドに関する国の方針は、かなり良いこと書いているし他の人に伝えるときの説得力もある良い資料ですよね。
BTCのクマ松さんのプレゼンで知ってから活用させてもらってます。

LT③ AWSサービスメニュー開発をしていてAWSを好きだ!と感じた瞬間

大崎コンピュータ 久保田亨さん

Bedrock使えば簡単に生成AIをマネジメントコンソールで試せるのが良いですよね。