MCP Tool Search|コンテキスト85%削減

MCP Tool Search|コンテキスト85%削減

この記事の結論

Claude CodeのMCP Tool Searchは遅延ロードでコンテキスト85%削減。設定方法を解説。

MCPサーバーを7つ以上接続した途端、Claude Codeが極端に遅くなったり、エラーを返し始めた経験はないだろうか。

原因はツール定義の肥大化だ。5つのMCPサーバーだけで約55,000トークン、JiraのようなサーバーはそれだけでAC17,000トークンを消費する。作業を始める前の「準備」でコンテキストの大半が消えていた。

2026年1月、AnthropicのThariq Shihipar(Technical Staff)がこう発表した:「Today we’re rolling out MCP Tool Search for Claude Code.」この機能は、その問題を根本から変えた。


そもそもMCP Tool Searchとは何か

MCP Tool Search(別名:Lazy Loading for MCP)は、すべてのMCPツール定義を会話の最初に読み込むのではなく、必要な時点でのみ該当ツールを発見・ロードするDynamic Tool Discoveryの仕組みだ。

従来の動作:

# 従来のMCP読み込み(概念図)
# 会話開始時に全ツール定義を一括ロード
# 例: 50+ツール × 平均1,500トークン = 75,000トークン消費
# → 実際の作業に使えるコンテキストが激減

MCP Server A: 12,000 tokens (30 tools)
MCP Server B: 17,000 tokens (Jira - 25 tools)
MCP Server C:  8,000 tokens (GitHub - 15 tools)
...
合計: ~77,000 tokens 消費後に作業開始

Tool Search有効時の動作:

# Tool Search有効後(概念図)
# ライトウェイト検索インデックスのみを事前ロード
# 実際に使うツールだけをオンデマンドで取得

起動時: 検索インデックス ≒ 8,700 tokens
作業中: "deploy this container" → 関連ツール3-5個 ≒ 3,000 tokens
合計: 必要ツールのみ消費(1クエリあたり約3K tokens)

動作環境: Claude Code(全バージョン)、2026年1月以降デフォルト有効

注意: 本番環境で使用する前に、必ずテスト環境で動作確認してください。

何が新しいのか——従来との違い

比較項目 従来(一括ロード) Tool Search(遅延ロード)
起動時トークン消費 最大134K tokens 約8.7K tokens
実使用コンテキスト 122.8K tokens消費 191.3K tokens確保
MCPサーバー数上限 実質3-5サーバー 実質制限なし
ツール検索方法 全定義が常に存在 キーワード検索でオンデマンド取得
精度(Opus 4) 49% 74%(MCP評価テスト)
精度(Opus 4.5) 79.5% 88.1%(MCP評価テスト)

Anthropic社内テストでは、~134Kトークンが~5Kまで削減——約85%のトークンオーバーヘッド削減を確認している。精度の改善は特に重要で、大規模なツールライブラリでは必要なツールを見逃すことが多かったが、Tool Searchが的確なツールを引き当てることで解決された。

具体的に何ができるようになるのか

実務的な変化は3点に集約される。

1. MCPサーバーをためらいなく追加できる

これまでは「このサーバーを追加したらコンテキストが足りなくなる」という心理的コストがあった。Tool Searchによって、必要なツールを全部登録してClaudeに任せるアプローチが現実的になった。

2. 長期的なアーキテクチャ設計が変わる

マルチエージェントシステムでは、各エージェントに「必要最小限のMCPサーバーだけ割り当てる」設計が主流だった。Tool Searchがあれば、エージェントが自分で必要なツールを探しに行けるため、設計の自由度が上がる。

3. GitHub Issue #7336「Lazy Loading for MCP Servers」が解決

GitHubで長期間リクエストされ続けた機能が正式に実装された。コミュニティが作ったPoC(machjesusmoto/claude-lazy-loading等)の問題意識が反映されている。

よくある誤解

「Tool Searchを有効にするために設定が必要」——これは誤り。

Tool SearchはMCPツール定義が10,000トークンを超えた時点で自動的に起動する。ユーザーが何かをオンにする必要はない。確認したい場合は /context コマンドでトークン使用状況を、/doctor コマンドでMCPサーバーの詳細を確認できる。

「既存のMCPサーバーを改修する必要がある」——これも誤り。

Tool Searchは既存のすべてのMCPサーバーと互換性がある。サーバー側の変更は不要だ。

「95%削減」と「85%削減」、数字がいくつかある——これは文脈の違い。

「85%削減」はAnthropicの内部テスト(~134K→~5K)の数値。「95%削減」は初期コンテキスト消費量の削減を指す別の文脈での数値(77K→8.7K、約88%削減という計算もある)。いずれにせよ「大幅に削減される」という事実は変わらない。

結局どうすればいいのか

今すぐできることは3つ。

1. MCPサーバーをためらわず追加する:これまで「コンテキストが足りなくなるから」と躊躇していたサーバーを追加してみる。Tool Searchが自動で最適化する。

2. 現状を確認する:既存の設定で /context を実行し、ツール定義がどの程度のトークンを消費しているか把握する。10K以下ならTool Searchは起動しない(必要ない)。

3. マルチエージェント設計の見直し:エージェントごとに「専用MCPセット」を持たせていた設計を、共通ツールプールからオンデマンド取得する設計に移行できるか検討する。

MCPの基本概念から理解したい場合はMCPの完全ガイドを参照してほしい。Claude Codeの他の最新機能についてはClaude Code・Cursor・WindSurf比較記事でも触れている。

参考・出典


あわせて読みたい:


AIエージェント設計・MCPを活用した開発環境の最適化支援については、株式会社Uravationにご相談ください。

この記事はAIgent Lab編集部がお届けしました。

Need help moving from reading to rollout?

この記事を読んで導入イメージが固まってきた方へ

Uravationでは、AIエージェントの要件整理、PoC設計、社内導入、研修まで一気通貫で支援しています。

この記事をシェア

X Facebook LINE

※ 本記事の情報は2026年4月時点のものです。サービスの料金・仕様は変更される可能性があります。最新情報は各サービスの公式サイトをご確認ください。

関連記事