Windsurf Wave 13完全解説|並列エージェントとArena Mode

Windsurf Wave 13完全解説|並列エージェントとArena Mode

この記事の結論

Windsurf Wave 13の目玉機能を徹底解説。Git worktrees統合の並列マルチエージェント、AIモデル比較のArena Mode、構造化Plan Modeの使い方と無料SWE-1.5モデルを紹介。

「Windsurfって結局Cursorの二番手じゃないの?」

2025年末、そう思っていた開発者が一斉に考えを改めることになった。2025年12月24日にリリースされたWindsurf Wave 13は、単なるアップデートではなかった。Git worktrees統合による真の並列マルチエージェント、ブラインド比較のArena Mode、構造化タスク計画のPlan Mode——これだけの機能を一度に投入してきたのは、AI IDE市場での勝負所と判断したからだろう。

しかも無料。SWE-1.5モデルを3ヶ月間無料で提供するという施策は、「フリーが新しい標準」という市場の流れを自ら加速させるものだ。この記事では、Wave 13の4つの目玉機能を一つひとつ丁寧に解説し、開発者として何をどう使えばいいかを整理する。


Windsurf(旧Codeium)が採用している「Wave」シリーズは、重要な機能アップデートをまとめてリリースする形式だ。Wave 13は「Shipmas Edition」と名付けられ、2025年12月24日——クリスマスイブ——に公開された。

公式アナウンスによると、Wave 13の主な変更点は以下の4つだ。

  • SWE-1.5 Free: Cognition/Devin開発の高性能コーディングモデルを3ヶ月無料提供
  • 並列マルチエージェント(Git worktrees統合): 最大5つのCascadeエージェントを同時実行
  • Arena Mode: 2つのAIモデルを匿名で比較するブラインドテスト機能
  • Plan Mode: コード生成前にタスク全体を構造化プランとして可視化

AIエージェントの基本概念や他ツールとの位置づけについては、AIエージェント構築完全ガイドで体系的にまとめているので参照してほしい。

何が新しいのか — Wave 13以前との違い

Windsurfのコア機能「Cascade」は、プロジェクト全体を自律的に読み込み・編集するAIエージェントだ。しかしWave 12まで、Cascadeは基本的に「1セッション1タスク」の設計だった。複数の課題を同時に進めようとすると、ブランチを手動で切り替えながら逐次的に処理するしかなかった。

機能 Wave 12まで Wave 13
並列エージェント 非対応(手動ブランチ切替) Git worktrees統合、最大5並列
モデル比較 逐次的に試すしかない Arena Modeで匿名ブラインド比較
タスク計画 エージェントに一任 Plan Modeで構造化プラン事前作成
デフォルトモデル SWE-1(有料) SWE-1.5 Free(3ヶ月無料)
ターミナル システムシェル依存 専用zshプロファイル(Beta)
コンテキスト可視化 なし ウィンドウ使用率インジケーター

具体的に何ができるようになるのか

並列マルチエージェント:Git worktrees統合の仕組み

Wave 13の最大の変化は、「真の並列エージェント」を実現したことだ。

Gitには「worktrees」という機能がある。同一リポジトリから複数のワークツリーを同時にチェックアウトし、異なるディレクトリで別ブランチを操作できる仕組みだ。Wave 13はこれをCascadeと統合し、それぞれのworktreeに独立したCascadeセッションを割り当てた。

実際の使い方のイメージはこうだ。たとえば、バグ修正を5件並行して進めたいとする。これまでは1件ずつ片付けるか、複数のIDEウィンドウを立ち上げて手動管理するしかなかった。Wave 13では、5つのworktreeにそれぞれCascadeエージェントを割り当て、マルチペインのUIで同時進行を監視できる。

公式Xアカウントの発表によると、「5つの異なるバグに対して5つのエージェントを同時起動し、マルチペインで監視できる」ことが確認されている。各エージェントはGit historyを共有しながらも、互いに干渉しない独立したディレクトリで動作する。

注意点として、Gitが初期化されていないワークスペースでは並列エージェントとArena Modeの両方が使えない。利用前に git init を実行しておく必要がある。

Arena Mode:ブラインドでAIモデルを比較する

Arena Modeは、同じタスクを複数のAIモデルに並列実行させ、どちらの出力が優れているかをブラインドで判定する機能だ。

通常のIDEでモデル比較をしようとすると、「まずGPT-4oで試す → 出力を見る → 次にClaudeで試す → 比較する」という逐次的な作業になる。この方法には問題がある。先に見たモデルの出力が判断に影響するバイアスが生じやすい点だ。

Arena Modeはこれを解決する。各モデルは匿名で提示され、コードの品質だけで判定できる。気に入った方に「X is better」ボタンで投票する設計だ。

公式ドキュメントによると、モデルは「Battle Groups」としてキュレーションされている。

  • Frontier: GPT 5.2、Claude Opus/Sonnet 4.5など高性能モデル群
  • Fast: SWE-1.5、Claude Haikuなど高速モデル群
  • Hybrid: 上記2つの組み合わせ

各モデルは個別課金となり、複数選択時はコストが合算される点は把握しておきたい。Gitが初期化されたワークスペースが必要なのも並列エージェントと同様だ。

正直に言うと、Arena Modeは「あればいい機能」ではなく、長期的にモデル選定を最適化したい開発者にとって実用的な選択肢になり得る。特に、タスク種別ごとにどのモデルが自分の用途に合うかを経験的に学べるのは大きい。

Plan Mode:コード生成前に「計画」を見る

Plan Mode(Planning Mode)は、Cascadeがコードを書き始める前にタスク全体の構造化プランを提示する機能だ。Wave 10で初登場し、Wave 13でさらに洗練された。

通常、Cascadeは指示を受けると即座にコード生成に入る。これは小さなタスクでは効率的だが、複数ファイルにまたがる大規模な機能追加や、アーキテクチャ変更を伴う改修では、「気づいたら意図と違う方向に進んでいた」という事態が起きやすい。

Plan Modeを有効にすると、Cascadeは以下の挙動をとる。

  • 実装に入る前にタスク全体のプランを提示し、承認を求める
  • 各ステップ実行前に計画を参照し、逸脱がないか確認する
  • 新しい情報(メモリ更新など)を取得した場合、プランを自動更新する
  • Todoリストを会話内に生成してタスク進捗を可視化する

バックグラウンドでは専門化した計画エージェントが長期プランを継続的に改善しており、選択したモデルは短期的なアクションに集中するという二層構造になっている。

公式ドキュメントには「megaplan」という高度なフォームも記載されており、Cascadeが追加の質問をしながらより精緻なプランを作成するオプションも存在する。

SWE-1.5 Free:950トークン/秒の実力

SWE-1.5はCognition(Devinを開発したチーム)が開発した、ソフトウェアエンジニアリング専用のモデルだ。Wave 13の発表に合わせ、2026年3月末まで無料で提供される(SWE-1.5 Free)。

最大の特徴はその速度だ。Cerebasとの協力により最大950トークン/秒で動作し、これはClaude Sonnet 4.5(約69トークン/秒)の約13倍、Haiku 4.5の約6倍に相当する。

ベンチマーク数値を整理すると次のようになる。

モデル 速度(トークン/秒) SWE-Bench Pro精度 料金(Wave 13時点)
SWE-1.5 Free 最大950 約40.08% 無料(3ヶ月限定)
Claude Sonnet 4.5 約69 約43.60% 有料(クレジット消費)
Claude Haiku 4.5 約160 非公開 有料(クレジット消費)

精度ではSonnet 4.5に3.5ポイント差をつけられているものの、速度は13倍以上。「ほぼ同等の精度で13倍速く完了する」という価値提案は、反復的なコーディング作業では特に有効だ。Kubernetesマニフェストの編集が従来の約20秒から5秒未満に短縮されたという実測報告も出ている(参照: Cognition公式ブログ)。

ただし、SWE-1.5 Freeは「標準スループット」での提供となっており、有料プランのSWE-1.5と比べてスループットが制限されている点は注意が必要だ。ピーク時のレスポンスは遅くなる可能性がある。

よくある誤解

「Arena ModeはPlan Modeと同じ機能だ」

似た名前が並んでいるため混同しやすいが、両者はまったく異なる目的の機能だ。

Arena Modeは「どのモデルが優れているかを比較する」ためのもの。複数モデルを並列実行してブラインドで評価する。一方、Plan Modeは「1つのモデルが作業に入る前に計画を立てる」ための機能だ。タスクの複雑さを事前に整理し、意図しない方向への暴走を防ぐ。

「並列エージェントは誰でも簡単に使いこなせる」

これは過大評価だ。byteiota.comの分析が的確に指摘しているが、DORA 2025レポートではPRレビュー時間が91%増加していることが示されており、コード生成が速くなっても「レビューのボトルネック」は依然として残る。シニアエンジニアは並列エージェントをうまく調整できる一方、ジュニア開発者は認知的オーバーヘッドとコンフリクト管理で苦戦するケースが多い。

並列エージェントを有効活用するには、タスクの分割設計と各エージェントの出力レビューを責任をもって行える体制が必要だ。「エージェントに丸投げして5倍速くなる」という単純な話ではない。

「SWE-1.5はSonnet 4.5より性能が高い」

速度は圧倒的に上回るが、コーディング精度ではSonnet 4.5が上だ(SWE-Bench Proで43.60% vs 40.08%)。SWE-1.5の優位性は「高速で許容範囲の精度」という点にあり、高い正確さが要求される複雑な推論タスクでは必ずしも最良の選択ではない。用途に応じてモデルを使い分けることが重要だ。

「Plan Modeは全タスクで使うべきだ」

Plan Modeはオーバーヘッドを伴う。小さなバグ修正や単純なファイル編集では、計画フェーズが不要なステップになりかねない。公式ドキュメントも「複数ファイルにまたがる変更、アーキテクチャ変換、未知のコードベースでの作業」を特に有効なシーンとして挙げており、逆に言えば単純作業には向かない。

結局どうすればいいのか

Wave 13の機能は、適切なシーンで使えば開発フローを大きく変える可能性がある。以下のシーン別に使い分けを整理した。

並列マルチエージェントを使うべきタスク

  • 互いに依存関係のない複数バグの同時修正
  • 異なるモジュールでの機能追加を並行して進める場合
  • 複数のPR候補を同時に検討したい場合

Arena Modeを使うべきタスク

  • 新しいモデルが登場したときの実用性検証
  • 特定の繰り返しタスク(テスト生成、リファクタリングなど)でのモデル最適化
  • チームで使うモデルを決定する前の比較評価

Plan Modeを使うべきタスク

  • 10ファイル以上にまたがる大規模リファクタリング
  • 新機能の設計・実装(要件が複雑な場合)
  • 初めて触るコードベースでの作業

SWE-1.5 Freeを使うべきタスク

  • 反復的なコーディング作業(テスト追加、ドキュメント生成、軽微な修正)
  • 高速なフィードバックループが重要なTDD開発
  • まずコストを抑えながらWindsurfを評価したい場合

AIエージェントツールの比較全般については、AIエージェント構築ツール徹底比較も参照してほしい。各ツールの強みと弱みを網羅的にまとめている。

この先どうなるか

Wave 13は明らかに、Cursorへの正面対抗を意識した内容だ。価格は$15/月(Cursorは$20/月)、並列エージェントはCursorの最大8エージェントに対して5エージェントと若干劣るが、Git worktrees統合によるコンフリクトフリーな並列化は差別化になっている。

SWE-1.5の3ヶ月無料というキャンペーンが2026年3月で終了したとき、ユーザーがどう動くかが次の焦点だ。有料に移行するか、他のモデルに切り替えるか。Windsurfがこの期間でどれだけユーザー習慣を形成できるかが、中長期の競争優位に直結する。

また、「Arena Mode」という概念——IDEの中でモデル評価を完結させる——は、今後のAI IDEで標準的な機能になっていく可能性がある。現時点でこれを提供しているのはWindsurf独自の動きであり、先行者優位を確立しようとしているのは明らかだ。

筆者の見方では、Wave 13最大の意義は「機能数」ではなく、並列エージェントとArena Modeを組み合わせることで「AIに指示して待つ」から「AIと並走して判断する」という開発フローの変化を促している点だ。これは開発者の役割を根本から変えていく話であり、ツールの習熟度だけでなく、タスク設計の能力が問われる時代になりつつある。

参考・出典


AIエージェントの導入・活用支援については、株式会社Uravationにお気軽にご相談ください。100社以上の企業向けAI研修・導入支援の実績があります。ご質問・ご相談は お問い合わせフォームからどうぞ。

この記事はAIgent Lab編集部がお届けしました。

あわせて読みたい: Autoresearch完全解説|コード編集→実験→最適化を自動ループするAI研究ツール

Need help moving from reading to rollout?

この記事を読んで導入イメージが固まってきた方へ

Uravationでは、AIエージェントの要件整理、PoC設計、社内導入、研修まで一気通貫で支援しています。

この記事をシェア

X Facebook LINE

※ 本記事の情報は2026年3月時点のものです。サービスの料金・仕様は変更される可能性があります。最新情報は各サービスの公式サイトをご確認ください。

関連記事