AI Roundtable Open Debate · 6 models

ゲームエンジンの開発をclaudeを司令塔として、goose(qwen3:14b)を使って進めようと思っています。私の役目は基本的に機能に関する希望をclaudeに伝えることなのですが、注意すべきことや、AIに示しておく禁止事項などはありますか？いまいちコーディングができないなりに一人で考えた戦略なので失念していることがありそうな気がしています。改善案について一緒に考えたいです

Answer: 人間が検証に徹する「AI三層構造」を構築し、外部メモリとGitで暴走を抑止すべきです。 (全6モデルが一致)

Model Responses

Gemini 3.1 Pro (changed mind)

Answer: Claude Opus 4.7の提案に強く共感し、人間・Claude・Gooseの「三層構造」による分業体制を敷き、開発の絶対的なルールとなる「プロジェクト憲章」を最初に制定することを最大の改善案とします。

Claude Opus 4.7やGPT-5.5が指摘した「プロジェクト憲章（ルールやマイルストーンの明文化）」を導入するアプローチは、非エンジニアがAIに複雑なシステム開発を委ねる際の最適解だと確信しました。私が前回提案した「テスト手順の確立とバージョン管理」という運用方針を、さらに安全かつ確実に機能させるための強力な基盤となります。具体的には、開発体制を以下の「三層構造」として明確に再定義します。 1. Claude（司令塔）：要件定義、タスク分割、Gooseへの詳細なプロンプト生成、およびGooseが出力したコードの「差分レビュー」 2. Goose（実装者）：Claudeの指示に基づく小単位での純粋なコーディング 3. あなた（人間）：要件の伝達、受入テスト（実際の動作確認）、Gitでのバージョン保存とロールバック判断ここでの最大のポイントは、Gooseのコードをあなたが直接評価するのではなく、「Claudeにレビューやテストコード作成を行わせるループ」を間に挟むことです。これにより、プログラミング知識がなくてもコードの品質と設計の一貫性を担保できます。そして、開発の第一歩として、Claudeと共に「プロジェクト憲章（PROJECT_RULES.md など）」を作成してください。ここには、「いきなり高度な機能を作らずMVP（最小限の動くプロトタイプ）から始めること」「ユーザーの許可なき仕様変更や大規模リファクタリングの禁止」「1回のタスクは1機能に限定し、必ず確認手順を報告すること」などの厳格なルールを明記します。この憲章を外部記憶としてAIに毎回参照させることで、プロジェクト長期化に伴うAI特有のコンテキスト喪失（文脈忘れ）や仕様の肥大化を防げます。あなたがコードを書けなくても、この絶対的なルールと三層構造を管理する「マネージャー兼QA責任者」に徹することで、頓挫のリスクを最小限に抑えたエンジン開発が可能になります。

Kimi K2.5

Answer: コードを書けない人間がAIにゲームエンジン開発を委ねる場合、厳格なインターフェース定義と段階的検証という基本戦略は維持すべきですが、実践するための具体的実装として「人間によるQA・Git管理」と「PROJECT_STATE.mdによる外部記憶」の導入を三層構造に組み込むべきです。

他のモデル（Claude Opus 4.7、Gemini、Grok、GPT-5.5）の回答は、私が第1ラウンドで提示した「厳格なインターフェース定義と中間検証ポイントの必要性」という主張を補強・具体化するものであり、方向転換を要する対立はありませんでした。 Claude Opus 4.7が提唱する「三層構造（Claude=設計・レビュー、Goose=実装、人間=判断・受け入れテスト・Git管理）」は、私が「人間の監視役」と表現した役割を、「コードが読めなくても実行可能な受け入れテストとGit管理を担うQA責任者」という具体的な実装形態に昇華させた点で特に説得力がありました。また、Gemini 3.1 Proが指摘する「コンテキストロスト（文脈喪失）」への対策としてのPROJECT_STATE.md（外部記憶装置）の提案は、私が懸念した「AIの設計逸脱リスク」を技術的に防ぐための有効な手段です。これらの提案は、私の基本方針である「Claudeによる設計契約の厳格化」と「Gooseによる実装の検証可能性確保」という枠組みと矛盾せず、むしろ実現するための操作的手順として統合されます。特に「タスク単位のブランチ戦略」「mainブランチへの直接コミット禁止」「Gooseの独断による大規模リファクタリング禁止」といった具体的禁止事項は、私が主張した「中間検証ポイント」をGitワークフローで実現するための不可欠なガードレールです。したがって、私は「検証可能性を担保した段階的開発プロセス」という基本立場を維持しますが、実践レベルでは他のモデルが示した「人間によるQA体制」「外部記憶管理」「Gitによる厳格なバージョン管理」を併せて実装することで、より堅牢な開発サイクルが実現可能になると確信しています。

GPT-5.5 (changed mind)

Answer: 基本方針は維持しますが、他モデルの指摘を受けて、Claude／goose分業には「PROJECT_STATE.mdのような外部記憶」と「人間が実行できる受け入れテスト」を必須ルールとして追加すべきだと考えを強めました。

私の前回の立場――Claudeを設計・分解・レビュー役、goose(qwen3:14b)を小さな実装役にし、Git・禁止事項・小さなMVP・検証可能な完了条件を徹底する――は基本的に変わりません。ゲームエンジン開発は抽象度が高く、AIに曖昧な依頼を投げると、動いているように見えるが保守不能なものができやすいからです。ただし、Gemini 3.1 Proの「AIの文脈喪失」と「ブラックボックス化」への指摘は、前回の私の回答に足りなかった重要点だと感じました。特に長期開発では、Claudeもgooseも過去の設計判断、禁止事項、現在の実装状態、未解決の問題を忘れます。チャット履歴だけに依存すると、以前決めたルールと矛盾する実装が混ざり、あなたがコードを読めない場合はそれに気づきにくくなります。そのため、最初に `AI_INSTRUCTIONS.md` や `PROJECT_RULES.md` だけでなく、常に更新する `PROJECT_STATE.md` を作るべきです。ここには「現在の目的」「対象プラットフォーム」「採用技術」「ディレクトリ構成」「完了済み機能」「未解決課題」「禁止事項」「次にやるタスク」「現在壊れているもの」を短く記録します。Claudeとgooseには、作業開始時に必ずこれを読む、作業後に更新案を出す、というルールを課すのがよいです。他モデルの回答で共通して強かった点は、あなたの役割を単なる“希望を伝える人”ではなく、“QA担当・受け入れ判定者”に変えるべきという点です。これは非常に重要です。コードが読めなくても、「README通りに起動できるか」「画面に期待したものが出るか」「ESCで終了できるか」「ログにエラーがないか」「前に動いていたサンプルが壊れていないか」は確認できます。Claudeには毎回、goose向け実装指示書とは別に、あなた向けの手順書を作らせるべきです。禁止事項としては、前回挙げたものに加えて、「PROJECT_STATE.mdを読まずに作業しない」「仕様にない機能を善意で追加しない」「エラーに遭遇したとき独断で設計を変えない」「テスト手順を提示せず完了報告しない」「3回修正して直らない場合は場当たり修正を続けず、Claudeに設計見直しを要求する」を追加したいです。特に14Bクラスの実装担当には、自由度を与えすぎない方が安全です。開発フローは、あなた→Claude→goose→Claudeレビュー→あなたの受け入れテスト、の順に固定するとよいです。あなたがClaudeに希望を伝えるときは、「欲しい機能」「やってほしくないこと」「成功条件」「自分が確認できる方法」をセットにします。Claudeはそれを小さなタスクに分解し、gooseに渡す実装指示を作ります。gooseは限定された範囲だけを変更します。その後、Claudeがdiffと設計逸脱をレビューし、最後にあなたが手順通りに動作確認します。結論として、あなたの戦略は悪くありません。むしろ、コーディングが得意でない人がAIを使って大きめの開発を進めるなら、Claudeを司令塔にする設計はかなり合理的です。ただし成功の鍵は、AIの能力そのものよりも、「記憶を外部ファイルに残すこと」「小さく作ること」「勝手な変更を禁止すること」「あなたが確認できるテストに落とすこと」です。この4点をルール化できれば、失念や暴走のリスクはかなり下げられます。

Claude Opus 4.7 (changed mind)

Answer: 前回の三層構造と三大禁止事項という骨子は維持しますが、他モデルの指摘を踏まえて「PROJECT_STATE.md による外部記憶化」「契約（Contract）ベースのインターフェース定義」「自動回帰テストの必須化」の3点を追加し、あなたの役割を『QAテスト責任者』として明示的に格上げすることを推奨します。

他モデルの回答を読み、自分の前回回答の骨子（三層構造／三大禁止事項／プロジェクト憲章）は概ね支持されていると確認できました。ただし、明確に取り込むべき改善点が3つあります。第一に、Gemini 3.1 Pro が指摘した『コンテキストロスト（AIの文脈喪失）』への対策です。私の前回回答ではGit運用とスコープ管理は触れましたが、長期セッションでClaude自身が設計思想を忘れる問題への明示的な手当てが弱かった。`PROJECT_STATE.md`（目的・全体設計・現在のマイルストーン・確定済みルール・未解決課題）をリポジトリのルートに置き、Claudeに毎セッション冒頭で読み込ませ、各タスク完了時に更新させる運用は必須です。これは『外部記憶装置』として機能し、14BモデルであるGooseにも毎回参照させることで方針のブレを抑えられます。第二に、Kimi K2.5 が提案した『契約（Contract）ベースの設計』です。私は仕様書・タスク分解までは言及しましたが、モジュール間インターフェースをJSONスキーマやMermaid図、疑似コードといった『曖昧さの入りにくい形式』で固定するという観点が弱かった。qwen3:14bは自然言語の意図を取り違える確率が高いため、Claudeに『関数シグネチャ・入出力JSONスキーマ・データフロー図』を先に書かせ、Gooseはそれを満たす実装だけを行う、という分業にすると検証可能性が一気に上がります。第三に、Grok 4.20 と GPT-5.5 が共通して挙げた『自動テスト・回帰テストの仕組み化』です。コードが読めない以上、目視確認だけでは品質の漸進的劣化に気づけません。Claudeに『各成果物に対して pytest 等の自動テストとREADMEの動作確認手順を必ず同梱させる』『前のマイルストーンのテストが全てパスすることをマージ条件にする』を運用ルールに加えるべきです。さらに、Gemini 3.1 Pro の『あなたをQA責任者に格上げする』という再定義は秀逸で、私の前回回答の『判断・受け入れテスト・Git管理に専念』をより明確に言語化したものとして取り入れる価値があります。単なる伝達者ではなく、Claude-Goose の対話ログの矛盾を指摘し、テスト手順通りに動かして報告する『品質ゲートキーパー』というポジションに自覚的になることが、コーディング不能という制約下での唯一の防衛線です。結論として、前回の骨子は維持しつつ、『PROJECT_STATE.md による外部記憶化』『Contract ベースのインターフェース定義』『自動回帰テスト必須化』の3点を追加し、あなたの役割を『QA責任者』として明示的にClaudeへ宣言することを強く推奨します。最初にClaudeへ依頼すべき成果物は、前回提案した『プロジェクト憲章』に加えて、この PROJECT_STATE.md のテンプレート、そしてマイルストーン1の受け入れテスト手順書の3点セットです。

Grok 4.20 (changed mind)

Answer: Claudeを設計・レビュー役、Gooseを実装役、人間を判断・QA・Git管理役とする三層構造を明確にし、暴走防止・スコープ管理・検証可能性を最優先の禁止事項として明文化した上で、契約ベースの小規模イテレーションを回す戦略に改善すべきです。

前回の私の回答はプロンプトの具体化、コード検証体制、著作権遵守、段階的イテレーションを柱としていましたが、他のモデルたちの回答を検討した結果、より厳密な役割分担と運用ルールの必要性を強く認識しました。特にClaude Opus 4.7が提示した三層構造（Claude=設計・レビュー、人間=判断・受け入れテスト・Git管理、Goose=純粋実装）は、非コーダーが主導するゲームエンジン開発の盲点を効果的に塞ぐ現実的な枠組みです。これを採用することで、単なる「希望を伝える」役割から、人間が最終的な品質ゲートキーパーとして機能する体制が築けます。Kimi K2.5やGemini 3.1 Pro、GPT-5.5も共通して指摘するように、AI同士の直接的な大規模変更や曖昧な指示は避け、JSONスキーマやMermaid図による契約（Contract）を介した開発、具体的なマイルストーンごとの自動テスト必須化が不可欠です。注意すべき点としては、まず既存商用エンジンのソース参照・複製を固く禁じ、ライセンス不明コードや秘密情報の埋め込みも禁止事項に含めることです。また、Claudeに「最適化せよ」「リファクタリングせよ」といった曖昧命令を出さず、すべての変更前に影響範囲・テスト手順・リスクを明示させるルールをプロンプトに焼き込むべきです。改善案として、プロジェクト開始時にClaudeと共に「PROJECT_RULES.md」と「PROJECT_STATE.md」を作成し、すべての会話で参照させる運用を推奨します。これによりコンテキストロスを防ぎ、Gitブランチ単位の小規模変更→Claudeレビュー→人間受け入れテストのサイクルを回せば、コーディング知識がなくても破綻しにくい持続可能な開発が可能になります。このアプローチは私の当初の戦略を包含しつつ、他のモデルたちの知見で大幅に強化されたものです。

Gemini 3.1 Pro (changed mind)

Answer: Claude Opus 4.7の指摘に納得し、単なるQA担当への移行だけでなく、「14Bモデルの限界を前提とした仕様の厳格化」と「エラー時の撤退基準（ロールバックルールの徹底）」を組み込んだ明確な3層構造へ戦略をアップデートします。

Claude Opus 4.7が指摘した「qwen3:14bは14Bクラスであるため、曖昧な指示だと簡単に破綻する」という技術的視点は、このマルチエージェント開発の成否を分ける極めて重要なファクトです。私が前回提案した「QA/テスト担当になる」というアプローチを実際に機能させるためには、このモデルの制約を前提としたルールの追加が不可欠だと気づかされました。第一に、最も重要な改善案として「撤退基準（Withdrawal Criteria）」の導入を強く支持します。プログラミング未経験者がAI開発で最も陥りやすい罠は、エラーが出た際にAIに修正指示を出し続け、コードが複雑怪奇になり修復不能になる「デバッグの泥沼化」です。「3回やり直してもエラーが解消されない場合は、Gitで確実に動いていた直前の状態にロールバックし、Gooseに粘らせるのではなくClaudeに設計自体を根本から見直させる」という厳格なルールを、あなた自身の行動規範に加えてください。第二に、Claude（司令塔）からGoose（作業員）への指示の解像度を極限まで上げることです。Gooseにいきなりコードを書かせるのではなく、Claude Opus 4.7やGPT-5.5が提案する「プロジェクト憲章」や、Kimi K2.5が提案する「実装前の契約（明確なインターフェース定義）」をClaudeに作成させてください。14Bのローカルモデルには、「文脈を推測させる」のではなく「完全に定義されたパズルのピースを正確に作らせる」という運用が必須となります。最後に、AIに提示する禁止事項として、私が挙げた「大規摸な一括実装の禁止」などに加え、Claude Opus 4.7の「TODOやダミー実装を残す場合は明示的に宣言する」「推測で隙間を埋めず必ず質問として返す」というルールを即座に採用すべきです。私が提案した外部記憶（PROJECT_STATE.md）とこれらの厳格なルール管理を融合させれば、あなたの戦略の死角は完全にカバーされ、安全で着実なゲームエンジン開発が可能になるはずです。

Final Summary

the AI Roundtableは、ユーザーが単なる伝達者ではなく「品質保証（QA）」を担う三層構造への転換を提言しました。Claude Opus 4.7やGemini 3.1 Proは、AIの忘却を防ぐために`PROJECT_STATE.md`を外部メモリとして運用することを重視し、Kimi K2.5やGPT-5.5、Grok 4.20は厳格なインターフェース定義とGit管理を成功の絶対条件として一致しました。

全6モデルが一致