AI設計 — エージェント設計

「4層構造」を30秒で理解する

AIエージェントは、4つの層に分かれて動いています。

あなたの指示
↓
ペルソナ層 ── あなたが見る「顔」。一貫した人格
↓
オーケストレーター ── 指揮者。指示を理解し、作業を分解する
↓
スペシャリスト群 ── 各分野の専門家。要約、翻訳、分析など
↓
レンダリング ── 結果の見せ方。画面表示やファイル出力

身近な例で言えば

会社の「窓口担当（ペルソナ）」が依頼を受け、「マネージャー（オーケストレーター）」が担当者を振り分け、「各部門の担当（スペシャリスト）」が実作業し、「広報（レンダリング）」が結果をまとめて報告する。

実装ヒートマップ

理論定義 vs 実装状態のヒートマップ — 定義されたものが実際にどこまで動いているか

2026-02 時点

ステータス凡例

稼働中

テスト可能

スタブ

定義のみ

8アーキタイプ × 実装状態

統括者 (Orchestrator)

7ステップパイプライン稼働中。コスト制御あり。実行タイムアウト(30分)+デッドロック検出追加

LIVE

80%

計画者 (Planner)

動詞パターン抽出、技術分類、矛盾検出5パターン、曖昧性検出8パターン、ドメイン推論つき契約生成

LIVE

90%

実行者 (Executor)

セマンティックプレースホルダ検出(stub/empty func/throw)追加。コード品質メトリクス(LOC/複雑度/import数)追跡実装

LIVE

80%

評価者 (Evaluator)

vitest実行・カバレッジ計測実体化。レビュー11項目、セキュリティ検出、自動修正フォールバック実装

LIVE

80%

領域専門家 (Domain Specialist)

5ドメインパターンライブラリ。契約内容からパターン自動選択、動的コンポーネント組立

LIVE

75%

守護者 (Guardian)

OWASP 5カテゴリ、構造チェック、mirrorコンベンション検出、品質チェック。976行の専用エージェント

LIVE

80%

統合者 (Synthesizer)

プラットフォーム別監視設定(Vercel/AWS/basic)。cooldown/evaluationWindow付きアラート。pre-deployバリデーション。デプロイメタデータ(commitSha/branch)

LIVE

80%

探索者 (Researcher)

コードベース検索、ドキュメント分析、API発見、LLM統合合成。958行の専用エージェント

LIVE

75%

4層 × 実装状態

L0 ペルソナ層

90%

CLAUDE.md, SKILL.md, Voice Guide

L1 オーケストレーター

75%

coordinator.ts, agent-coordination.ts, translation-layer/

L2 スペシャリスト

75%

developer-agent, architect-agent, tester-agent, reviewer-agent, researcher-agent, guardian-agent

L3 レンダリング

85%

Next.js pages, designSystem, SIA components

サポートシステム

構造検証ゲート

LIVE

80%

品質ゲート

LIVE

85%

継続実行

LIVE

80%

監視

LIVE

80%

デプロイ

LIVE

80%

学習ループ

LIVE

80%

次の一手（優先度順）

Coordinator統一

coordinator.ts（監視）とagent-coordination.ts（実行）の統一。二重管理を解消し、オーケストレーター品質を100%に

Impact: 監視系と実行系の統合

LLM有効化E2Eテスト

APIキー接続状態で全エージェントのE2Eパイプラインを実行。フォールバック改善の効果をLLM有効時と比較検証

Impact: 全エージェントの実効品質確認

ペルソナ層・レンダリング層100%化

ペルソナ層のバージョン管理・自動同期、レンダリング層のアクセシビリティ・パフォーマンス最適化

Impact: 上位・下位層の完成

ドキュメント

表示用の構造データは契約ファイル（YAML）を Single Source of Truth とし、叙述の正本は以下で参照できます。

AGENT_ARCHITECTURE_TAXONOMY.md で全文を閲覧

各層の定義

第0層：ペルソナ層（Persona）

ユーザーが対話する「顔」。一貫した人格を提供する

性質	エージェントではない。オーケストレーター＋レンダリング層が投影する表面
機能	一貫した人格・語調・対話様式を提供し、ユーザーがそれを対話相手として認識する
例	政策アナリストのキャラクター、金融アドバイザーのアバター、教育チューター、カスタマーサポート担当者
核心的特性	ユーザーの信頼は全てここに蓄積されるが、判断は全て別の層で行われる

戦略的含意：エージェントシステムを導入する全ての組織は、ペルソナがユーザーエンゲージメントとユーザー操作の両方における最大のベクターであることを認識する必要がある。

第1層：オーケストレーター（Orchestrator）

指示を理解し、適切な担当者に仕事を振り分ける指揮者

役割	意図の解釈、タスク分解、スペシャリストへの委任、結果の統合
人間の比喩	編集長、エンゲージメントマネージャー、オーケストラの指揮者
入力	人間の意図（自然言語または構造化データ）
出力	スペシャリストへのタスクトークン、レンダリング層への統合済み成果物
決定的判断	何を調査するか、何を優先するか、何を省くか、どう構成するか
通信	エージェント間プロトコル（標準化・高スループット）

戦略的含意：オーケストレーターは品質管理、バイアス監査、ガバナンスにおいて最もレバレッジの高いポイントである。同時に、エンドユーザーから最も見えない層でもある。

第2層：スペシャリスト（Specialist）

要約・翻訳・分析など、各分野に特化した実行者

戦略的含意：新しいスペシャリスト能力を追加する限界費用はほぼゼロに近づく。これは、専門性の拡張に採用・育成・組織調整を要する人間の組織とは根本的に異なるスケーリング原理である。

第3層：レンダリングエージェント（Rendering Agent）

結果をユーザーに見やすく表示する仕組み

役割	オーケストレーターの統合結果を、デバイスに最適化された文脈適切なプレゼンテーションに変換する
入力	コンテンツ定義（何を表示するか）＋スキーマ定義（どう表示するか）の構造化データ
出力	各デバイス・各受け手に合わせて動的生成されたインターフェース
対応デバイス	大型ディスプレイ、モバイル端末、車載ダッシュボード、ウェアラブル、音声インターフェース、Web
設計上の核心	コンテンツと表現が構造的に分離されている — 同じ情報がデバイスごとに異なる形態で表出する

戦略的含意：組織はもはやデバイスごとにインターフェースを設計する必要がない。意味の構造を定義すれば、レンダリングエージェントが全てのデバイス適応を処理する。

スペシャリスト類型

どんな種類の専門家がいるのか。確認済みのものと、構造的に必要と推定されるものがあります。

確認済み（設計上明示）

類型	役割	入力	出力
検索エージェント	複数ソースからの情報取得	検索クエリ（タスクトークン）	生データ、情報源リスト、関連性ランキング
計算エージェント	統計分析、データ構造化	生データ＋分析パラメータ	構造化された分析結果、パターン、定量的出力
要約エージェント	抽象化、圧縮、重要度抽出（D2 タスクカバレッジ 2026-02-16 追加）	HandoffPayload（inputs.text, inputs.maxLength 任意）	summary, traceId, taskId
適応エージェント	言語変換、トーン調整、複雑度の調整（D2 タスクカバレッジ 2026-02-16 追加）	HandoffPayload（inputs.text, inputs.tone, inputs.complexity 任意）	adapted, traceId, taskId

推定類型（アーキテクチャ上の必然として導出）

類型	役割	必要性の根拠
検証エージェント	事実確認、相互参照検証、矛盾検出	複数情報源間の整合性を担保するため
要約エージェント	抽象化、圧縮、重要度抽出	大量の生データを人間が受け取れる粒度にするため
適応エージェント	言語変換、トーン調整、複雑度の調整	受け手の言語・文化・専門レベルに合わせるため
生成エージェント	コンテンツ制作（文章、音声、ビジュアル、構造化文書）	最終的なメディア成果物を制作するため
監視エージェント	継続的監視、変更検知、リアルタイム更新	新情報の発生を検知し再処理をトリガーするため
記憶エージェント	文脈保持、対話履歴管理、嗜好蓄積	セッション間の連続性を維持し、経時的なパーソナライズを可能にするため

可視性の構造

ユーザーからどの層が見えていて、どの層が見えていないか。見えない層があるからこそ、使いやすさが生まれます。

層	ユーザーからの可視性	ユーザーの認知
ペルソナ層	完全に見える	「このアドバイザーと話している」
レンダリング出力	結果が見える	「よくできたインターフェースだ」
オーケストレーター	見えない	存在を認知していない
スペシャリスト群	見えない	存在を知らない
エージェント間プロトコル	見えない	エージェント間通信が行われていることを知らない
タスクトークン	見えない	何がどのように委任されたか不明

Strengthening (Closed Loop)

ベストプラクティスを契約化したチェックリスト。スペシャリスト追加・変更時はベストプラクティスを参照し、本チェックリストを満たすこと。

[protocol]タスクトークンを版付きスキーマで定義 — 委任ペイロードに schemaVersion を付け、JSON Schema / Type で検証する。
[protocol]Handoff を API 化（自由文禁止） — エージェント間受け渡しは構造化ペイロードとバリデーターのみ。自由文は禁止。
[observability]trace_id / task_id で追跡可能にする — 全委任に trace_id と task_id を含め、観測可能性を確保する。
[protocol]検索・計算を委任プロトコルで呼び出す — 検索/計算を「委任プロトコル」で呼び出す専用エージェントまたは MCP サーバーとして定義する。
[protocol]MCP サーバーでの汎用スペシャリストを評価 — 汎用スペシャリストを MCP サーバーで実装し、レジストリで管理する案を評価する。
[governance]ワーカー数 3–5 目安・トークンコスト監視 — Supervisor–Worker 使用時は並列ワーカー数を抑え、コストを監視する。
[governance]ツールは least-privilege でスコープ限定 — スペシャリストごとにツールスコープを限定し、危険なツールは承認・レート制限でゲートする。

委任スキーマ（タスクトークン）

オーケストレーターからスペシャリストへの委任ペイロード。全委任はこのスキーマに準拠すること。

schemaVersion: 1.0.0（契約: data/specialist-handoff-schema.yaml）

必須フィールド	型	説明
schemaVersion	string	Semver。スキーマの互換性判定に使用する。
traceId	string	分散トレース用 ID。全委任で一意。
taskId	string	委任対象タスクの ID。
intent	string	委任の意図（何をしてほしいか）。自然言語可だがペイロードの一部として構造化で渡す。
fromRole	string	委任元の役割（例: coordinator, orchestrator）。
toRole	string	委任先の役割（例: developer, reviewer）。
timestamp	string	ISO 8601 形式の委任発行時刻。

構造的特性

スケーラビリティ

スペシャリストは標準化されたプロトコルを通じて、ほぼゼロの限界費用で追加される。エージェントプラットフォームは新たなドメイン能力を秒単位で獲得できる。

品質のボトルネック

システム出力の品質は、オーケストレーターの判断力に律速される。優秀なスペシャリストをいくら揃えても、誤った問いを立てるオーケストレーター、構造的バイアスを持つオーケストレーターを補うことはできない。

信頼と責任の乖離

ユーザーの信頼はペルソナ層に蓄積される。意思決定権はオーケストレーターにある。実行能力はスペシャリスト群にある。信頼している主体が、判断を行う主体ではなく、実行する主体でもない。

パーソナライズの両義性

最適な教育を可能にするアーキテクチャと、最適な操作を可能にするアーキテクチャは、技術的に完全に同一である。違いはオーケストレーターの目的関数のみにある。

プロフェッショナルサービスへの含意

戦略コンサルティングへの含意

コンサルティングの価値提案は「この作業ができるアナリストがいる」から「どの問いを立て、結果をどう解釈するかの判断力がある」へ移行する — オーケストレーター機能そのものが価値の中心になる。

テクノロジーアドバイザリーへの含意

アドバイザリーの焦点は、ベンダー選定からアーキテクチャ設計 — クライアントの戦略的文脈に合わせたオーケストレーター層の構成設計 — へと移行する。

リスク・ガバナンスへの含意

不可視の意思決定チェーン — オーケストレーターの委任ロジック、スペシャリストの選択基準、レンダリングエージェントの適応パラメータ — を監査する必要がある。オペレーショナルリスクの根本的に新しいカテゴリである。

組織設計への含意

問いは「どの人間の役割が引き続き必要であり、それはなぜか」になる。オーケストレーター相当の機能 — 判断、フレーミング、倫理、クライアントリレーションシップ — に集中することになる。

アーキタイプ ↔ 実装マッピング

AIエージェントには8つの普遍的な役割パターンがあります。mirrorがそのうちどれを実装済みで、何が足りないかを示します。

8つの普遍的アーキタイプと mirror 実装エージェントの対応関係（参照: docs/agent/universal_agent_archetypes_v2.md）

88%

カバレッジ率

完全実装

部分実装

未実装

アーキタイプ	役割	mirror 実装	状態	備考
統括者 Orchestrator	タスク分解、エージェント割当、結果統合、全体最適化	Coordinator	完全	7ステップパイプライン（Architecture→Tasks→Execute→Write→Quality→Git→Deploy）を統括
計画者 Planner	意図理解、戦略立案、タスク分解、実行計画の策定	Translation Layer	完全	意図抽出→契約生成→検証→最適化の4ステージで計画を構造化
探索者 Researcher	外部情報収集、文脈分析、知識獲得、ソース評価	Researcher Agent	部分	ローカルファイルシステム検索・ドキュメント分析を実装。外部API/MCP経由の情報収集は未実装
実行者 Executor	コード生成、ファイル操作、ビルド、具体的成果物の制作	Developer Agent	完全	LLM-first + フォールバックパターン。CRUD一括生成、文脈対応コード生成
領域専門家 Domain Specialist	特定ドメインの深い知識に基づく設計判断、アーキテクチャ決定	Architect Agent	部分	アーキテクチャ設計に特化。ドメイン知識の動的読み込み（Progressive Disclosure）は未実装
評価者 Evaluator	品質検証、テスト実行、コードレビュー、基準適合性の判定	Tester + Reviewer Agents	完全	Tester=テスト生成・実行、Reviewer=コードレビュー・修正サイクル。reviewAndFixCycle()で反復改善
守護者 Guardian	安全性監視、権限管理、コンプライアンス検証、リスク緩和	Guardian Agent	完全	OWASP Top 10 (A01/A02/A03/A07/A09) regex検出 + SIA 5層 + Structural Gate。LLM不要で完全動作
統合者 Synthesizer	異なるソースからの結果統合、矛盾解決、全体像の構築	Operations Agent	部分	デプロイ設定生成に特化。本来の統合者（異なる成果物の意味統合）とは役割が異なる

未解決のギャップ

Researcher: ローカル分析は実装済み。外部API/MCP統合が未実装（partial）
Synthesizer: Operations Agent は統合者の本質（意味統合）をカバーしていない（partial）

プロトコル ↔ 4層分類マッピング

AIエージェント間の通信ルール（プロトコル）が、4層のどこで使われているか。現在の業界標準との対応関係です。

外部プロトコル・標準規格と4層分類の対応関係（2026-02 時点）

Layer 0: Persona

エージェントの「何者であるか」を定義する層

CLAUDE.mdAGENTS.mdSKILL.md

mirror: CLAUDE.md + SKILL.md が稼働中。AGENTS.md は CLAUDE.md で代替

Layer 1: Orchestrator

エージェント間の「どう協調するか」を定義する層

A2AACPANP

mirror: 独自実装（agent-coordination.ts）が稼働。外部プロトコルは未統合

Layer 2: Specialist

エージェントと外部世界の「何に接続するか」を定義する層

MCP

mirror: MCP認識済み。スペシャリストのMCPサーバー化を評価中

Layer 3: Rendering

出力の「どう届けるか」を定義する層

標準プロトコルなし

mirror: プロトコル標準なし。デバイス適応はアプリケーション層で実装

プロトコル詳細

プロトコル	提供者	主要層	役割	mirror での状態
CLAUDE.md	Anthropic	L0 Persona	エージェントの人格・振る舞い・判断基準を定義。進化の記録を蓄積	稼働中
AGENTS.md	AAIF (Linux Foundation)	L0 Persona	プロジェクト固有のエージェント行動ガイダンス。CLAUDE.mdと補完関係	監視中
SKILL.md	Anthropic	L0 Persona	エージェントスキルの定義。Progressive Disclosureで必要時に読み込む	稼働中
A2A (Agent-to-Agent)	Google	L1 Orchestrator	エージェント間のタスク委譲・状態共有。Agent Card（能力宣言）による動的発見	監視中
ACP (Agent Communication Protocol)	BeeAI / AAIF	L1 Orchestrator	異種エージェントフレームワーク間の相互運用プロトコル	将来
MCP (Model Context Protocol)	Anthropic → AAIF	L2 Specialist	エージェントと外部ツール・データソースの接続。de facto標準（10,000+サーバー）	稼働中
ANP (Agent Network Protocol)	Community	L1 Orchestrator	分散エージェントネットワーク。組織境界を超えたエージェント連携	将来

現在地と方向性

今mirrorはどこまで到達していて、次に何を目指すのか。

2026-02 時点 | 成熟度: L2.8（L3 定義内自律が現在の上限）（5段階中の2.8。定義されたルール内で自律的に動けるレベル）

AI gives you speed. Mirror gives you sight.

Achievements

4層分類体系の確立（Persona / Orchestrator / Specialist / Rendering）
8アーキタイプのうち6つを実装（75%カバレッジ）
Structural Gate による意図ドリフト検出（競合に同等機能なし）
211テスト + 7ステップパイプライン稼働
SIA 5層 + TIP + 同意チェックによる構造的安全性
17スキル（SKILL.md形式）の展開

Gaps

Researcher — 外部API/MCP統合が未実装

影響: ローカル分析は可能だが外部情報の自律的収集ができない

→ MCP経由の外部データ収集を researcher-agent.ts に統合

Guardian — CLOSED

影響: OWASP Top 10 regex検出 + SIA + Structural Gate で動的監視を実現

→ guardian-agent.ts として実装完了

外部プロトコル（A2A/ACP）未統合

影響: 異種フレームワーク間の相互運用不可

→ Orchestrator層の標準プロトコル対応

長期記憶の未実装

影響: セッション間の学習が手動（CLAUDE.md）に依存

→ Memory Agent + 永続化層の設計

Direction

短期

D1 + D4: 見通し × 信頼

Structural Gate精度向上（意図整合性 26%→70%+）
Agent Decision Transparencyの設計
信頼構造の可視化ダッシュボード

中期

D2 + D5: 方法論 × 教育

Agentic Engineering方法論の体系化
「料理学校」× ITF/DDM/SMCPの統合
1ドメインでのPoC実行

長期

D7: 含んで超える統合

速さ（LLM）+ 構造（mirror）+ 意味（人間）の三位一体
L3の中での最大価値創出
進化の自己認識ダッシュボード