「Codex」という言葉の混乱を整理する――モデル・ハーネス・サーフェスの三層構造
「Codexって結局何?」という疑問を持ったことがあるエンジニア全員に届けたい記事。特にモデルとハーネスの共設計という事実は、AIエージェントアーキテクチャを考える上での重要な示唆を含んでいる。
OpenAIの「Codex」という名称、実はかなり多義的に使われていて混乱しやすい。そこにOpenAI APACのDeveloper Experience EngineerであるGabriel Chuaが自らの言葉で整理を試みたのが今回の記事だ。彼の定義によれば、Codex = モデル + ハーネス + サーフェスという三層構造で捉えられる。ここで「ハーネス」とは指示群とツール群のコレクションを指し、オープンソースとしてopenai/codexリポジトリに公開されている。 この記事でとりわけ注目すべきは、OpenAI内部者として初めて明言された以下の事実だ。「Codexモデルはハーネスの存在を前提として訓練されている」——つまり、ツール呼び出し、実行ループ、コンテキスト圧縮、反復検証といった振る舞いは後付けの機能ではなく、モデルの学習プロセスに組み込まれた本質的な能力だという。ハーネス側もモデルの計画・ツール呼び出し・失敗からの回復パターンに合わせて設計されており、両者は共進化した関係にある。 個人的にこの「モデルとハーネスの共設計」という視点はとても刺さった。多くの開発者がLLMにツールを後付けで繋いで苦労している現状を考えると、モデル訓練の段階からエージェント動作を前提に設計するアプローチは、パフォーマンスと信頼性において根本的に有利なはずだ。AIエージェント開発に携わるエンジニアなら、この設計思想を理解しておく価値は高い。