ニュース

AIエージェント「管理」元年|1週間で4社が動いた

AIエージェント「管理」元年|1週間で4社が動いた

この記事の結論

OpenAI GPT-5.4 mini/nano、Kore.ai AMP、Workday Sana、Gartner予測。3月17日に集中した4つの発表から、AIエージェントが構築から運用フェーズに移行する構造変化を読み解く。

3月17日、月曜日。AIエージェント業界にとって、この日は記録すべき1日になった。

OpenAIがマルチエージェント前提の小型モデルを投入し、Kore.aiがエージェント管理の統合基盤を発表。同日、Workdayは業務AIを「提案」から「実行」に転換するプラットフォームをローンチし、Gartnerは政府機関の80%が2028年までにAIエージェントを導入するという予測を公開した。

偶然の一致ではない。AIエージェントは「作る」フェーズから「管理する」フェーズに移行しつつある。この記事では、同じ日に起きた4つの発表を時系列で追い、その背景にある構造変化を読み解く。

3月17日午前: OpenAI、GPT-5.4 mini/nanoを投入——サブエージェント時代のモデル設計

OpenAIがGPT-5.4 miniとGPT-5.4 nanoをリリースした。注目すべきは、これらが単体で使うモデルではなく、マルチエージェントシステムの「実行役」として設計されている点だ。

公式ブログには明確にこう書かれている。「GPT-5.4 miniは、GPT-5.4のような大型モデルがプランニングと判断を担い、より小さなモデルがサブタスクを並列実行するワークフローに最適化されています」。要するに、1つの巨大モデルに全部やらせる時代は終わり、役割分担する前提のアーキテクチャが標準になりつつある。

性能面では、GPT-5.4 miniがSWE-Bench Proで54.4%(GPT-5 miniの45.7%から大幅改善)、OSWorld-Verifiedで72.1%を記録。GPT-5.4に迫るスコアを、2倍以上の速度で叩き出している。

モデル SWE-Bench Pro OSWorld-Verified API入力単価
GPT-5.4 57.7% 75.0%
GPT-5.4 mini 54.4% 72.1% $0.75/1M tokens
GPT-5.4 nano 52.4% 39.0%
GPT-5 mini 45.7% 42.0%

出典: OpenAI公式ブログ(2026年3月17日公開)。ベンチマークはxhigh reasoning effortでの測定値。

開発者にとっての実務的な意味は明確だ。Codexでは、GPT-5.4 miniはフルモデルの30%のクォータしか消費しない。つまり同じ予算で3倍以上のサブエージェントを回せる。分類・データ抽出・コードベース検索といったタスクをnanoに任せれば、さらにコストは下がる。

正直、これは驚いた。OpenAIがここまで明確に「モデルは組み合わせて使うもの」と打ち出したのは初めてだ。AI開発エージェント4強比較で取り上げたCodexの進化にも、この設計思想が直結している。

3月17日午後: Kore.ai、エージェント管理プラットフォーム「AMP」を発表

同じ日の午後、Kore.aiが「Agent Management Platform(AMP)」を発表した。これは、企業内に散在するAIエージェントを一元的に監視・統制するための司令塔だ。

背景にあるのは「AIスプロール」問題。Gartnerの予測では、2028年までに企業は数千のAIエージェントを運用することになる。各チームがバラバラにLangGraph、CrewAI、AutoGen、Google ADK、AWS AgentCore、Salesforce Agentforceなどでエージェントを構築し、誰も全体像を把握していない——そんな状態が生まれ始めている。

Kore.ai CTOのPrasanna Arikala氏は「AIエージェントは企業内の新しいソフトウェアワークフォースになりつつある。しかし、中央集権的なガバナンスなしでは、組織はAIの運用に対する可視性とコントロールを失うリスクがある」と述べている。

AMPの特徴は2つ。第一に、本番デプロイ前にエージェントの振る舞い・ワークフロー・アウトカムをテストできる評価スタジオ。第二に、特定のエコシステムに縛られないアグノスティックなアーキテクチャだ。LangGraphで作ったエージェントもSalesforce Agentforceのエージェントも、同じ管理画面から監視できる。

これまで「エージェントをどう作るか」が議論の中心だった。AMPの登場は、議論が「エージェントをどう管理するか」に移ったことを象徴している。A2Aプロトコルとは?で解説したマルチエージェント連携の標準化と合わせて、エージェント間の「つなぎ方」と「管理の仕方」が業界の主戦場になりつつある。

3月17日: Workday「Sana」、業務AIを提案から実行へ転換

Workdayが「Sana from Workday」を全世界でローンチした。2025年11月のSana社買収からわずか4カ月。統合のスピードだけでも注目に値する。

SaaS業界では、AIアシスタントが「おすすめの回答はこちらです」と提案するパターンが主流だった。Sanaはそこから一歩踏み込んで、実際にタスクを実行する。「自宅住所を更新して、税務フォームと福利厚生への影響を表示して」と頼めば、複数システムをまたいで処理が走る。

3つのレイヤーで構成されている:

  • Sana for Workday: Workday内の新しい会話型AIインターフェース
  • Sana Self-Service Agent: HR・財務ワークフローを自動化する300以上のスキルを搭載
  • Sana Enterprise: Gmail、Outlook、Salesforce、SharePoint等の外部システムとも連携

Workday共同創業者・CEOのAneel Bhusri氏は「AIは信頼性のある決定論的なシステムに接続されたときにのみ、企業で機能する」と語っている。裏を返せば、既存の権限管理・コンプライアンス・監査フレームワークの上でエージェントを動かすことが、エンタープライズAIの必須条件だということだ。

SaaS全面エージェント化の衝撃で論じた「操作する時代の終わり」が、Workdayという巨大プラットフォームでも現実になった。

3月17日: Gartner、政府機関80%が2028年までにAIエージェント導入と予測

Gartnerが発表した予測は、AIエージェントの波が民間だけでなく公共セクターにも到達することを示している。2028年までに、世界の政府機関の少なくとも80%が、日常的な意思決定を自動化するためにAIエージェントを導入するという。

ただし、Gartnerの調査(2025年7-9月、138の政府機関対象)は、課題も浮き彫りにしている。41%が「サイロ化された戦略」、31%が「レガシーシステム」をAI導入の障壁として挙げている。技術のモダナイゼーションだけではこれらの問題は解消されない、とGartnerは指摘する。

もう1つ重要な予測がある。2029年までに、政府機関の70%が、市民サービスに影響する自動意思決定に対してExplainable AI(XAI)とHuman-in-the-Loop(HITL)メカニズムを義務化するという。つまり、エージェントは導入されるが、ブラックボックスのままでは許されない。

これはAIエージェント規制が一気に動いた2週間で追った規制の流れと符合する。技術の進化と規制の整備が、同時進行で起きている。

全体を通して見えること——「ビルド」から「オペレーション」へ

1日に起きた4つの発表を俯瞰すると、1つの構造変化が見える。

AIエージェントのライフサイクルが「構築(Build)」から「運用(Operate)」フェーズに入った。

OpenAIのGPT-5.4 mini/nanoは、マルチエージェント構成を前提にしたモデル設計。Kore.aiのAMPは、散在するエージェントの一元管理。Workdayの Sanaは、既存の権限・コンプライアンス基盤の上でのエージェント稼働。Gartnerの予測は、公共セクターでの大規模デプロイメント。

すべてに共通するのは、「エージェントを動かすこと自体」はもう問題ではなくなりつつあるということだ。問題は、どう安全に管理し、既存のビジネスプロセスに統合し、スケールさせるか。

開発者にとっては、エージェント構築のスキルに加えて、ガバナンス・オブザーバビリティ・コスト管理の知識が求められるようになる。筆者も判断がつかないのは、この「管理レイヤー」がどのプレイヤーに収斂するかだ。Kore.aiのようなスタートアップが標準を取るのか、AWS・Google・Microsoftのクラウドベンダーが自社エコシステム内で閉じるのか。この争いは2026年後半の最大の見どころになるだろう。

開発者が今週押さえるべき3つのポイント

  1. マルチエージェント設計を前提にする: GPT-5.4 mini/nanoの登場で、「大きなモデル1つで全部やる」アーキテクチャは明確にコスト非効率になった。プランナー+エグゼキューター構成を今から試しておくべき
  2. エージェントの可視性を確保する: 本番環境にエージェントを投入するなら、パフォーマンスメトリクス・コスト・異常検知の仕組みは初日から必要。Kore.ai AMPに限らず、Langfuseのようなオブザーバビリティツールの導入を検討すべきタイミングだ
  3. 権限管理をエージェント設計に組み込む: Workday SanaもGartnerの予測も、エージェントが既存の権限・監査フレームワークの中で動くことを前提としている。ガードレールの実装は「あったら嬉しい」から「必須」になった

まとめ

3月17日に起きた4つの発表は、それぞれ独立した出来事だが、1つの方向を指している。AIエージェントは「実験」から「業務インフラ」になりつつあり、それに伴ってガバナンス・管理・セキュリティが議論の中心に移っている。

エージェントを「作れる」ことはもはやアドバンテージではない。「安全に運用し続けられる」ことが、次の差別化ポイントになる。

参考・出典

AIエージェントの導入・運用についてのご相談は、お問い合わせフォームからお気軽にどうぞ。


この記事はAIgent Lab編集部がお届けしました。

Need help moving from reading to rollout?

この記事を読んで導入イメージが固まってきた方へ

Uravationでは、AIエージェントの要件整理、PoC設計、社内導入、研修まで一気通貫で支援しています。

この記事をシェア

X Facebook LINE

※ 本記事の情報は2026年3月時点のものです。サービスの料金・仕様は変更される可能性があります。最新情報は各サービスの公式サイトをご確認ください。

関連記事