エージェントハーネス構築
エージェントの計画、ツール呼び出し、エラーからの回復、完了への収束を改善する場合にこのスキルを使用します。
コアモデル
エージェントの出力品質は以下によって制約されます:
- アクション空間の品質
- 観測の品質
- 回復の品質
- コンテキストバジェットの品質
アクション空間の設計
- 安定した明示的なツール名を使用する。
- 入力スキーマファーストで絞り込んだものにする。
- 決定論的な出力形状を返す。
- 分離が不可能な場合を除き、キャッチオールツールは避ける。
粒度ルール
- 高リスク操作(デプロイ、マイグレーション、権限)にはマイクロツールを使用する。
- 一般的な編集・読み取り・検索ループには中規模ツールを使用する。
- ラウンドトリップのオーバーヘッドが支配的なコストである場合のみマクロツールを使用する。
観測の設計
すべてのツールレスポンスに含めるべき内容:
-
status: success|warning|error
-
summary: 一行の結果
-
next_actions: 実行可能なフォローアップ
-
artifacts: ファイルパス / ID
エラー回復コントラクト
すべてのエラーパスに含めるべき内容:
- 根本原因のヒント
- 安全なリトライ指示
- 明示的な停止条件
コンテキストバジェット管理
- システムプロンプトを最小限かつ不変に保つ。
- 大きなガイダンスはオンデマンドで読み込まれるスキルに移動する。
- 長いドキュメントをインラインで挿入するより、ファイルへの参照を優先する。
- 任意のトークン閾値ではなく、フェーズの境界でコンパクト化する。
アーキテクチャパターンガイダンス
- ReAct: 不確実なパスを持つ探索的タスクに最適。
- 関数呼び出し: 構造化された決定論的フローに最適。
- ハイブリッド(推奨): ReAct 計画 + 型付きツール実行。
ベンチマーク
追跡すべき指標:
- 完了率
- タスクあたりのリトライ数
- pass@1 および pass@3
- 成功タスクあたりのコスト
アンチパターン
- セマンティクスが重複するツールが多すぎる。
- 回復ヒントのない不透明なツール出力。
- 次のステップなしのエラーのみの出力。
- 無関係な参照でコンテキストを過負荷にする。