omuronの備忘録

個人的な備忘録

「Codex Meetup Osaka #1」 #CodexMeetupOsaka 受講メモ

「Codex Meetup Osaka #1」 #CodexMeetupOsaka 受講メモ

Codex Meetup 初の大阪開催です。
このブログもAIの力を借りて書きました。

aiau.connpass.com

セッション

codex exec コマンドを使おう

LINEヤフー 成浦さん

  • 主役は codex exec サブコマンド
    • 通常のCLIやデスクトップアプリは「対話」前提だが、codex exec は会話せずに最後までやり切って結果だけ返してくれるコマンド
    • 標準出力を codex exec にパイプで流し込めるので、シェルスクリプト・CI・テストの中で使える
  • 「画像生成もできる」というネタも紹介。Codexはコーディング専用じゃなく、ドキュメント生成・社内情報検索・日本語検索代替としても使われ始めている
  • OpenTelemetry連携でCodexの動きを可視化する話
    • Codexは内部のリクエストが細かくなってきていて、何がボトルネックなのかが分かりづらい
    • OpenTelemetryのトレースをCodexに有効化させ、ビジュアライザに流すと、どのMCPに時間がかかっているか、どのモデルがどのコマンドを呼んでいるかが見える
    • ファイル読み込みでもモデルによって使うコマンド(cat / sed / 何か)が違うことが分かったり、「自分のモデルとは別のレーンで動いている」みたいな気づきがある
  • 将来的にはAIの生産性指標として使いたい、というクロージング
    • 「このMCPの呼び出しを何%減らせるか」みたいな具体的な改善の言い方が、本来はできるはず
    • AIに払うお金 → 取り戻している価値、という形での投資対効果を測りたい

codex exec は完全にスクリプタブルなインタフェースとして使えるので、CIの中に挟むとか、テスト失敗のサマリーを食わせて修正PRを起こさせる、みたいな使い方。

Codex goal機能を業務で現実的に活用する方法について

メルカリ / Kuuさん(Codexアンバサダー)

  • 普段はメルカリでアクセシビリティ担当。Codexアンバサダーでもある
    • 個人的にはデスクトップアプリ派、CLIよりUIアプリの方が好き
  • 今日は東京から車で大阪まで来たというツカミから入りつつ、本題は /goal 機能
  • /goal の基本
    • /goal {いい感じのやりたいこと} でCodexがゴール達成までいい感じにプランを立てて、実装し、確認まで完走してくれる
    • /goal resume は、間違ってEscape押した時・コマンドが落ちた時に再開する
    • バイブコーディングと見た目は似ているが、コンテキストの圧縮や最初の命令の忘却を /goal がカバーしてくれる
    • 48時間くらい黙々と動かし続けることもできる
  • 業務でどう「現実的に」使うかが本セッションの本題
    • 48時間動かして数万行のPRが出来ても、その後リリースまで回さないと業務にならない
    • 「飯食って帰ってきたら1個成功してたらOK」くらいの期待値で、複数チケットを並列に投げるのが現実解
  • くうさんの使い方3つ
    1. PoC作成:ゴールだけ伝えればプランは要らない。「Aという機能、実装できるか分からない」みたいなチケットURLを渡して /goal で投げる。お昼前に投げて、戻ってきて1個成功してたら良し。成功したコードをCodexに解説させると、ロジックが理解しやすい
    2. CI修正・テスト修正:ゴールが「CIをパスさせる」という形で明確で、結果がOK/NGで返ってくる領域は /goal 向き。レビューもしやすい
    3. PRレビュー:複数スレッドを立ち上げて、それぞれで別のPRをレビューさせる。発見があったところだけ人間が深掘りする
  • /goal を使いこなすコツ
    • OpenAIの公式が「/goal を使わずに、フルプロンプト + プリセットgoalで書いた方が良い場合がある」と発信している
    • 「抜け漏れのないコードレビュー」みたいな抽象度の高いゴールを直接渡すより、「ゴール自体をCodexに考えさせる」プロンプトを書いた方が良い結果が出る
    • もはやゴールを書くのもAIの仕事、という空気感

/goal 使い始めたら全部それで済ませたくなる→雑になる→使い分けが必要」という話。/goal は抽象度の高いタスクではなく「ゴールが定量的に測れるタスク(CIパスする・PRがマージできる)」に効く。

Codexで人生が狂わされた話

Gemcook / MJさん

  • 「Codexはエンジニアの本気ツールだと思って距離を置いていた」というところからスタート
  • 3、4日ガッツリ触ってみたら見え方が変わり、「これは革命」と感じてCodexに没入
  • 没入の本気度がすごい
    • Mac Studioのフルスペックをイギリスから取り寄せ(300万円超+関税)
    • AI専用のiPhone・専用の通信契約までAIに用意した
  • 日常生活への投入事例が一通り紹介された
    • LINE返信自動化:過去ログをLINEからエクスポート→人ごとのMDファイル→「自分っぽさ」を再現するスキルを作って、Computer Useで未読を /goal で一気に返信。Googleカレンダー連携で予定被りも防ぐ
    • 店選び:食べログ・グルメサイト・Instagramを横断してCodexに比較させる
    • 買い物自動化/goal で買い物を毎日実行させた結果、毎日プロテインが届いてダンボールが3つ積まれて怒られた
    • このLTスライド自体:Codex縛りで作成、手動編集なし
    • 経済情報:Bloomberg・Wall Street Journalを和訳要約させる、TOBの公開買付価格と現在レートの差をバッチで監視させてトレード判断に使う
    • 認知行動療法ベースのメンタルケア:思考の癖を整理する質問パターンをLINE返信に組み込む
    • 筋トレ記録:日々のパフォーマンスを記録、過去との比較分析
    • 交渉術スキル:交渉論文・心理学の名著を読ませた「交渉アドバイザー」スキル
    • 説明補助:「犬を知らない人に犬を説明する」みたいな抽象度の難しい説明をAIに任せる
  • まとめ:「Codexで人生が変わりました」

コーディングだけじゃなく、学習も助けてくれるCodex

SORAさん(大学生)

  • 大学生として機械学習・AIの講義を受けているが、数式・グラフ・コードが入り乱れて難しい
  • そこでCodexを「家庭教師」として使うシステムを自作した
  • 配布されるノート(PDF)を自分用に整える
    • 日英バイリンガル教材を日本語中心に絞ってくれる
    • 機械的に切るとURLや脚注が混入するので、Codexが文脈で判断して消す
    • 日英で同じ図が並んでいる場合、Codexが見比べて見やすい方を残す
    • GoodNotes用にダークモードPDFに変換、書き込みやすい余白を確保
  • 宿題は答えではなく「思考の道筋」を支えてもらう、先輩に質問する感覚で使う
  • AGENTS.mdを書き換えて、自分専用の家庭教師にカスタマイズできるのが、人間の家庭教師にはない強み
  • 「画像先生」スキルが特に気に入っている
    • 「この概念を初心者向けの図にして」と頼むと分かりやすい図を出してくれる
    • 「漫画風にして」「キャラクター化して」と頼むとイメージで腹落ちさせてくれる
    • 数式とコードのつながりが、視覚的に分かるのは強い
  • 復習問題の自動生成も便利
    • 講義の重要箇所を問題として出してくれる
    • 過去のチャットから「ここ弱そうだな」というところを集中的に問題化してくれる
  • 環境構築・エラー対応で勉強時間が消える問題、これがCodexで救われた
  • このLTスライドそのものも、iPadだけで作った(東京から大阪まで運転で来たので、Mac非搭載)
    • iPadの画面共有・Apple Pencil・Codexアプリだけで構築

大学生で、ここまでCodexを学習導線に組み込んでいるのが純粋にすごい。社会人になってからAIをツールとして覚えるのと、最初の学習体験からAIと並走するのとでは、その後の伸び方が違う気がする。

Codex Pets、思ったより仕事してる

きゅうかぶさん

  • Codexのペット機能(Codex Pets)を業務でちゃんと使い倒している話
  • ペット機能とは
    • Codex設定の外観タブから出せる、画面に常駐するキャラクター
    • デフォルトは青いロボット、設定からカラー・キャラを選べる
  • 何が嬉しいか
    • Codexの状態が画面の最前面に常に乗ってくる
    • 別アプリに切り替えていても、ペットの様子で「今考え中」「入力待ち」「レビュー可能」みたいな状態が一目で分かる
    • わざわざCodexのウィンドウに戻らなくていい
  • ペットはあくまでステータスのUIで、作業しているのはCodex本体
  • 自作ペットを作って配布
    • 自社プロフィール画像の周りに動物を浮かばせたカスタムペット
    • 業務中の遊び心として、チームメイトに配って楽しんでいる
  • 一見遊び要素に見えるが、業務集中の文脈で意外と効く、というのが結論

脆弱性検知後の運用をCodex Automationで半自動化した話

フェンリル / 平田 渉さん

  • AWS Inspectorで検知した脆弱性 → Backlog起票 → Slack通知 → 担当が中身を調査、というワークフローを半自動化した話
  • 背景
    • AI生成コードの増加に伴い、脆弱性検知数も体感で増えてきている
    • 通知だけ流れても、調査の手が足りない状況になりがち
  • 採用したのは Codex Automation の「スケジューラ」機能
    • 決まった時刻に決まったプロンプトをCodexに実行させる
    • 似たような枠で「Automations」「クエリ実行」もあるが、今回はスケジューラを利用
  • ワークフロー全体
    • スケジューラ起動 → Backlog課題一覧をCLI経由で取得(MCPは敢えて使わず、CLIにすることで本文を読み込まずに件名だけ参照できる)
    • 課題ごとにサブエージェントを起動して影響調査を実施
    • 結果をGoogleスプレッドシートに書き出し、対応要否の判断材料を整える
  • 設計上の工夫
    • サブエージェントでコンテキストを独立させ、ワークフロー全体のコンテキストを汚さない
    • 調査結果はPRD的なサマリーに整形、後で人間がチェックできる粒度に
    • ローカル実行のCodex CLI経由でClaude側のサブエージェントとも組み合わせる
  • 課題と注意点
    • Automation経由は外部ネットワークアクセスが禁止されている → network_access = true で動かす必要がある
    • 深夜に走らせるとちゃんと動いているか分からないので、最初は日中で監視しながら回す
  • 今後の改善
    • ローカル依存のオートメーションを、プラグ(共有可能な形)に置き換えてチームで使い回せるようにする
    • 他のワークフローへの展開(脆弱性以外のセキュリティ運用全般)

これは自分の業務にそのまま持ち込めるテーマで、特に「通知される脆弱性の量が増えて人が回らない」というのはどの組織でも起きている話。一次トリアージをCodex Automationに任せて、人間は最終判断だけする。