AIエージェント入門

Cursor Composer 2.5徹底解説|自社運用モデルの実力と使い所

Cursor Composer 2.5 自社運用コーディングモデル徹底解説

この記事の結論

Cursor Composer 2.5はKimi K2.5ベースの追加学習モデル。料金・並行エージェント・Bugbotとの関係、Claude/GPTとの使い分けを公式情報で解説します。

「CursorのComposer 2.5って、結局ClaudeやGPTを使うのと何が違うんだろう?」

2026年5月18日にCursorが「Composer 2.5」を発表してから、開発チームでこの質問を何度も受けました。Cursorの中でClaudeやGPTを動かしてきた人ほど、「わざわざCursor自前のモデルに切り替える意味があるのか」が気になるはずです。検証しながら公式発表を一行ずつ読み直してみると、いくつか誤解されやすいポイントがありました。とくに「Composer 2.5=Cursorがゼロから作った独自モデル」という理解は、公式の説明とはズレています。

この記事では、Composer 2.5が実際には何なのか、Cursor 3で入った「複数エージェント並行実行」や「Bugbot」とどう関係するのか、そしてClaude/GPTモデルとどう使い分けるべきかを、Cursor公式(cursor.com)の一次情報だけを根拠に整理します。バージョン番号も機能名も、公式で裏が取れたものだけで構成しています。

そもそもComposer 2.5とは何か(3つの要点)

細かい話に入る前に、まず誤解されやすい3点を押さえておきます。

  • 要点1:Composer 2.5はCursorが「追加学習(post-training)」したコーディング用エージェントモデル。ベースはMoonshot AIのオープンソースモデル「Kimi K2.5」のチェックポイントで、Cursorがゼロから作った基盤モデルではありません(Cursor公式発表・2026年5月18日)。
  • 要点2:料金は標準で入力100万トークンあたり$0.50・出力$2.50。「fast(高速)」版は入力$3.00・出力$15.00(Cursor公式・2026年5月18日時点)。
  • 要点3:使えるのはCursor IDE内とCursor SDK経由のみ。汎用の公開APIとして外部から叩けるモデルではありません。

対象読者:Cursorを日常的に使っている開発者・テックリード・PMで、モデル選択(Composer 2.5 / Claude / GPT)の判断軸が欲しい人。

今日やること:普段のリポジトリでまず一度、モデルをComposer 2.5(fast)に切り替えて、いつものタスクを1件だけ走らせて体感差を見る。

「自社開発モデル」という誤解 — 実態はKimi K2.5の追加学習

Composer 2.5を語るうえで最初に正確にしておきたいのが、モデルの出自です。

結論から言うと、Composer 2.5はCursorがゼロから事前学習した独自の基盤モデルではありません。Cursorの公式発表(blog/composer-2-5)の冒頭で、Composer 2.5は「Composer 2と同じオープンソースのチェックポイント、すなわちMoonshotのKimi K2.5の上に構築されている」と明記されています。つまりCursorがやっているのは、既存のオープンソースモデルに対するpost-training(追加学習・後段学習)です。

この点は、初代Composer 2のときに少し議論になりました。Composer 2の発表時にはKimiベースであることが明示されておらず、後にCursorの共同創業者がそれを「ミス(a miss)」として認め、Composer 2.5では発表の冒頭でMoonshotの系譜を明記した、という経緯があります(複数の技術メディアが報道)。

事例区分: 公開事例
以下はCursor公式およびメディア報道で公開されている情報をもとにしています。弊社の独自検証データではありません。

では「Cursor自社の何なのか」というと、追加学習のレシピと運用が自社のもの、という整理が正確です。Cursorは強化学習(RL)や合成タスクによる学習を自前のパイプラインで回しており、Composer 2と比べて大幅に多い合成タスクで学習したと説明しています。ベースモデルは借り物でも、「Cursorのエージェント体験に最適化した後段学習を施した、Cursor内で動くモデル」というのが実態です。

記事や社内資料で紹介するときは、「Cursorが独自開発した最新AIモデル」と書くと不正確になります。「CursorがKimi K2.5をベースに追加学習した、Cursor運用のコーディングモデル」と書くのが、公式の説明に沿った言い方です。

Composer 2.5で何が変わったのか(公式が挙げている改善点)

Composer 2.5の公式発表は、新機能をズラッと並べるタイプの発表ではなく、モデルの「振る舞い」の改善に焦点を当てています。発表の最初の段落で挙げられているのは、次の3点です(blog/composer-2-5、2026年5月18日)。

公式が挙げる改善点 意味(開発者目線)
長時間タスクでの持続的な作業が得意になった
(better at sustained work on long-running tasks)
1回の指示で複数ファイルにまたがる作業を、途中で見失わずに最後までやり切りやすくなった
複雑な指示をより確実に守る
(follows complex instructions more reliably)
「この規約に従って」「このディレクトリだけ触って」といった条件付き指示の取りこぼしが減る方向
協働がより快適になった
(more pleasant to collaborate with)
対話しながら直していくときの噛み合わせの改善

公式発表のページ本文には、SWE-Benchなどのベンチマークスコアが画像として掲載されているものの、本文テキスト中に具体的な数値スコアは書かれていません。そのため本記事では、特定のベンチマーク数値を「公式の確定値」としては掲載しません。第三者メディアはOpus 4.7と僅差といった数値を報じていますが、ベンチマークはバージョンや測定条件で順位が動くため、導入判断は自分のリポジトリでの実測を基準にすることをおすすめします。

ポイント:Composer 2.5は「新機能の塊」ではなく「同じComposer系列の中身が賢くなった」アップデートと理解するのが正確です。「fast(高速)」がデフォルトのオプションである点も、Composer 2から引き継がれています(公式発表)。

並行エージェント・PRレビューはどこの機能なのか(混同に注意)

ここが、二次情報で最も取り違えられやすいところです。「Composer 2.5で並行ビルドやPRレビューができるようになった」と書かれているのを見かけますが、機能の出どころを分けて理解する必要があります。

複数エージェントの並行実行は「Cursor 3」の機能

複数のAIエージェントを同時に走らせる仕組みは、2026年4月2日にリリースされたCursor 3で導入された「Agents Window」の機能です(blog/cursor-3)。公式ページには「Run many agents in parallel(多数のエージェントを並行実行する)」という見出しと、ローカル・クラウドのエージェントをサイドバーに一覧表示する「Agents Window」の説明があります。モバイル・Web・デスクトップ・Slack・GitHub・Linearから起動したエージェントが、すべて同じサイドバーに並びます。

これはIDE側(Cursor 3)の機能であって、Composer 2.5というモデルそのものの機能ではありません。並行実行されるエージェントの「中身」としてComposer 2.5を選ぶことはできますが、「並行実行=Composer 2.5の能力」と書くのは正確ではありません。なお、第三者の解説では「最大8エージェント」「Git worktreeで分離」といった具体仕様が語られていますが、これらはCursor公式のリリースページ本文には明記されていなかったため、本記事では断定しません。

コードレビュー(Bugbot)はComposer 2.5が「裏で動かしている」

レビュー系については、Cursorの「Bugbot」というレビュー機能との関係が公式に書かれています。Cursorのチェンジログ(2026年6月10日)には、「Composer 2.5の学習で得られた性能向上により、Bugbotが現在Composer 2.5で動いている」という趣旨の記述があります。同チェンジログでは、レビュー時間が約3倍速く・約22%安く・検出バグが約10%増えた、という改善が挙げられています(Cursor公式チェンジログ・2026年6月10日時点)。

つまり「PRレビュー的なもの」を担うのはBugbotという機能で、その中身のモデルとしてComposer 2.5が採用された、という関係です。「Composer 2.5にPRレビュー機能が付いた」ではなく、「BugbotのエンジンがComposer 2.5になった」と捉えるのが正確です。

あわせて、Cursor SDK側(チェンジログ・2026年6月4日)では、廃止されたcomposer-2というモデル指定(slug)が自動的にComposer 2.5へルーティングされるようになっています。SDKで古い指定を残していても、高速版(fast)の挙動は保たれる、という移行配慮です。

Composer 2.5とClaude/GPTの使い分け(判断の考え方)

Cursorの中ではClaude系・GPT系のモデルも引き続き選べます。では、いつComposer 2.5を選ぶべきか。公式発表はClaude/GPTとの直接比較を載せていないため、ここは公式が示している事実(料金・特性)から導ける判断の考え方として整理します。断定ではなく、選定の軸として読んでください。

事例区分: 想定シナリオ
以下は公式が公開している料金・特性をもとにした、典型的な使い分けの考え方です。すべてのチームに当てはまる断定ではありません。

状況 向いている選択(考え方) 理由
反復の多い実装・リファクタを大量に回す Composer 2.5(fast)を試す 標準$0.50/$2.50(100万トークンあたり)とトークン単価が低く、回数を回す使い方とコスト相性が良い
長い一連のタスクを途中で見失わせたくない Composer 2.5を試す 公式が「長時間タスクでの持続的作業が得意」と明示
最終成果物の品質を最優先したい難所 Claude/GPTなど使い慣れたモデルと比較 公式比較がない以上、難所は自分のタスクで横並び実測すべき
SDKで自動エージェントを組む Composer 2.5(@cursor/sdk) SDK経由で利用可能。旧composer-2指定は自動でルーティングされる

実務的には、「速くて安いComposer 2.5を一次ドライバーにして、詰まった難所だけ別モデルに切り替える」という二段構えが現実的です。Composer 2.5は汎用APIとして外に出せない(Cursor内とSDKのみ)ため、Cursorの外でパイプラインを組んでいるチームは引き続きClaude/GPTのAPIを使う、という棲み分けになります。

Cursorでのモデル切り替えの基本

モデルの切り替え自体は、Cursorのチャット/エージェント入力欄にあるモデルセレクタから行います。Composer 2.5は「fast(高速)」がデフォルトのオプションです(公式発表)。具体的なプラン別の提供条件や選択UIの細部はバージョンで変わるため、最新はCursor公式のモデルドキュメントで確認してください。

# Cursorでのモデル選択の考え方(擬似フロー・実コマンドではありません)
# 1. まず Composer 2.5 (fast) で実装タスクを回す
# 2. 期待どおり進まない難所だけ、使い慣れたモデルに切り替えて比較
# 3. SDKで自動化する場合は @cursor/sdk からモデルを指定
#    (旧 composer-2 指定は Composer 2.5 に自動ルーティングされる)

# 注意: 本番のコードベースで使う前に、影響範囲の小さいブランチやテスト環境で
#       一度モデルの挙動を確認してください。

動作環境の注意:Composer 2.5はCursor IDEおよびCursor SDK(@cursor/sdk)から利用する前提のモデルです。料金・提供範囲は2026年5月18日時点のCursor公式発表に基づく値であり、今後変更される可能性があります。

【要注意】よくある誤解と回避策

Composer 2.5まわりで、技術記事・社内共有でやりがちな取り違えと、その直し方です。

誤解1:「CursorがゼロからつくったAIモデル」と書く

❌ 「Cursorが独自開発した最新エージェントモデル Composer 2.5」
⭕ 「CursorがオープンソースのKimi K2.5をベースに追加学習した、Cursor運用のモデル Composer 2.5」

なぜ重要か:公式が冒頭でKimi K2.5ベースだと明記しています。出自を盛ると、読者が公式発表と照らしてすぐ気づき、技術メディアとしての信頼を落とします。

誤解2:「Composer 2.5で並行ビルド/PRレビューができる」と書く

❌ 「Composer 2.5の新機能:並行ビルドとPRレビュー」
⭕ 「複数エージェントの並行実行はCursor 3(Agents Window)の機能。レビューはBugbotが担い、そのエンジンがComposer 2.5になった」

なぜ重要か:機能(IDE側)とモデル(Composer 2.5)を混同すると、何を有効化すれば使えるのかが読者に伝わりません。

誤解3:第三者ブログのベンチマーク数値を「公式値」として載せる

❌ 「Composer 2.5はSWE-Benchで○○%(公式)」
⭕ 「公式発表ではスコアが画像で示されるのみ。数値は第三者報道。判断は自分のリポジトリでの実測で」

なぜ重要か:ベンチマークはバージョン・測定条件で順位が変わります。出典と測定条件が曖昧な数値を断定で載せると、すぐ陳腐化します。

まとめ:今日から試す3つのアクション

  1. 今日やること:普段のリポジトリで、モデルをComposer 2.5(fast)に切り替え、いつものタスクを1件だけ走らせて速度・追従性を体感する。
  2. 今週中:反復の多い実装はComposer 2.5、品質最優先の難所は使い慣れたモデル、という二段構えのルールをチームで言語化する。
  3. 今月中:Cursor 3のAgents Window(並行エージェント)とBugbot(レビュー)を、実際のワークフローに組み込めるか小さく検証する。料金・仕様は導入直前にCursor公式で再確認する。

よくある質問(FAQ)

Q1. Composer 2.5はCursorの独自モデルですか?

厳密には「独自に追加学習したモデル」です。ベースはMoonshotのオープンソースモデルKimi K2.5のチェックポイントで、Cursorがその上に強化学習などの後段学習(post-training)を施しています(Cursor公式発表・2026年5月18日)。ゼロから事前学習した基盤モデルではありません。

Q2. Composer 2.5の料金はいくらですか?

標準で入力100万トークンあたり$0.50、出力$2.50です。高速版(fast)は入力$3.00、出力$15.00です(Cursor公式・2026年5月18日時点)。料金は変更される可能性があるため、利用前に公式で確認してください。

Q3. Composer 2.5はAPIから直接使えますか?

汎用の公開APIとしては提供されていません。Cursor IDE内、またはCursor SDK(@cursor/sdk)経由で利用する前提です。Cursorの外でパイプラインを組む場合は、引き続きClaude/GPTなどのAPIを使うことになります。

Q4. 並行エージェントやPRレビューはComposer 2.5の機能ですか?

いいえ。複数エージェントの並行実行はCursor 3の「Agents Window」というIDE機能(2026年4月2日)です。レビューはCursorの「Bugbot」が担い、そのエンジンがComposer 2.5になりました(公式チェンジログ・2026年6月10日)。機能とモデルは分けて理解するのが正確です。

Q5. ClaudeやGPTからComposer 2.5に乗り換えるべきですか?

用途次第です。公式はClaude/GPTとの直接比較を出していません。反復の多い実装やコスト効率を重視するならComposer 2.5(fast)を試す価値があり、品質最優先の難所は使い慣れたモデルと自分のタスクで横並び比較するのが安全です。一律の「乗り換え推奨」はできません。

参考・出典

この記事を読んでAIコーディングエージェントの導入イメージが固まってきた方へ

Uravationでは、CursorやClaude CodeなどのAIエージェントを開発現場・チームに定着させるための研修・導入支援を行っています。


あわせて読みたい:


著者:佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。X(@SuguruKun_ai)フォロワー10万人超。100社以上の企業向けAI研修・導入支援。著書『AIエージェント仕事術』。

ご質問・ご相談はお問い合わせフォームからお気軽にどうぞ。

Need help moving from reading to rollout?

この記事を読んで導入イメージが固まってきた方へ

Uravationでは、AIエージェントの要件整理、PoC設計、社内導入、研修まで一気通貫で支援しています。

この記事をシェア

X Facebook LINE

※ 本記事の情報は2026年6月時点のものです。サービスの料金・仕様は変更される可能性があります。最新情報は各サービスの公式サイトをご確認ください。

関連記事