Pydantic AI 完全ガイド｜型安全エージェント構築

2026.05.27 公開 23分で読める

この記事の結論

Pydantic AIで型安全なAIエージェントを構築する実装ガイド。Agent定義、ツール、structured outputs、依存性注入、Anthropic/OpenAI統合まで実プロンプト集で解説。

「Pythonでエージェントを書きたいけど、LangChainは複雑すぎて辛い」「LLMの出力が辞書なのか文字列なのかコードを読まないと分からない」——AIエージェント開発の現場では、こうした型の弱さがそのまま運用バグになります。Pydantic AI は、Pydantic のバリデーション機構をエージェント層にそのまま持ち込み、「LLMの出力もツール呼び出しも、すべて型で守る」という設計思想で作られたフレームワークです。

本記事では、Pydantic AI を使って Anthropic Claude / OpenAI GPT を切り替えながら型安全なエージェントを構築する ための実装プロンプト集を、コピペで動くコード15本ベースで解説します。Agent オブジェクトの基本、ツール定義、structured outputs、依存性注入(DI)、LangChain との比較まで、現場で起きるハマりどころを中心にまとめました。検証は Python 3.11 + pydantic-ai 0.0.x 系で行っています(最終確認日: 2026-05-27)。

正直に言うと、Pydantic AI はまだ若いライブラリで、APIが破壊的変更されるリスクは残っています。だからこそ、「フレームワーク機能に依存しすぎず、Pydantic モデル + LLM API という素直な層で書く」 という割り切りが効きます。本記事はその割り切りを前提に、実務で2026年5月時点で安定して動くパターンだけを並べました。

まず試したい「5分即効」セットアップ3選

まず、Pydantic AI を触ったことがない方向けに、5分でエージェントが動く最小セットアップを3つ並べます。「とりあえず動かしてみる」ためのコピペ集として使ってください。

即効テクニック1：3行で動く最小エージェント

Pydantic AI の最大の特徴は、Agent オブジェクトを1行で宣言できることです。実際に空のプロジェクトで構築してみたところ、依存パッケージのインストール込みで2分かかりませんでした。

# 動作環境: Python 3.11+
# 必要パッケージ: pip install pydantic-ai
# 注意: 本番環境で使用する前に、必ずテスト環境で動作確認してください。

from pydantic_ai import Agent

agent = Agent(
    'openai:gpt-4o',
    system_prompt='You are a concise Japanese technical writer.',
)

result = agent.run_sync('Pydantic AIを一言で説明して')
print(result.output)
# → "PythonでLLMエージェントを型安全に書くためのフレームワークです。"

効果: LangChain で同等のことをやると ChatOpenAI + PromptTemplate + Chain で最低15行は必要ですが、Pydantic AI では Agent('openai:gpt-4o', system_prompt=...) の1行で済みます。
測定環境: Python 3.11.7, pydantic-ai 0.0.x, macOS 14。

即効テクニック2：Anthropic Claude への切り替えは1行

Pydantic AI のもう一つの強みは、モデル切り替えが文字列1つで完結すること。OpenAI で動かしていたエージェントを Claude に切り替えてみたら、変更行はたったの1箇所でした。

# 動作環境: Python 3.11+, ANTHROPIC_API_KEY 環境変数を設定
# 必要パッケージ: pip install "pydantic-ai[anthropic]"

from pydantic_ai import Agent

# OpenAI → Anthropic への切り替えは文字列を変えるだけ
agent = Agent(
    'anthropic:claude-sonnet-4-5',  # 'openai:gpt-4o' から変更
    system_prompt='You are a concise Japanese technical writer.',
)

result = agent.run_sync('AIエージェントとLLMの違いを30字で')
print(result.output)

効果: ベンダーロックインを避けたい場合、環境変数 + モデル指定文字列だけでフェイルオーバーが組めます。検証では、OpenAI レート制限時に Anthropic に切り替えるロジックを try/except 1ブロックで実装できました。

即効テクニック3：型を渡すだけの structured outputs

LLMの出力を Pydantic モデルで受け取る、これが Pydantic AI の真骨頂です。output_type に Pydantic モデルを渡すだけで、JSON Schema 生成・バリデーション・パースが自動化されます。

# 動作環境: Python 3.11+
# 必要パッケージ: pip install pydantic-ai

from pydantic import BaseModel, Field
from pydantic_ai import Agent

class MeetingNote(BaseModel):
    title: str = Field(description='会議タイトル')
    attendees: list[str] = Field(description='参加者の氏名')
    decisions: list[str] = Field(description='決定事項')
    next_actions: list[str] = Field(description='次回までのアクション')

agent = Agent(
    'openai:gpt-4o',
    output_type=MeetingNote,
    system_prompt='あなたは議事録要約のエキスパートです。',
)

raw_text = """
4月15日のAI導入定例。参加者は佐藤、田中、山本。
Pydantic AIをPoC採用することを決定。来週までに田中がプロトタイプを作成し、
山本が評価指標を整理する。
"""

result = agent.run_sync(raw_text)
print(result.output)
# → MeetingNote(title='AI導入定例', attendees=['佐藤', '田中', '山本'], ...)
print(type(result.output))  #

効果: json.loads() + KeyError 対策が一切不要になります。Pydantic 側のバリデーションエラーが出れば LLM 側に自動で再試行を投げる仕組み(Tool Retry)も組み込まれています。

Pydantic AI 設計の”3つのアプローチ”で考える

Pydantic AI でエージェントを設計するとき、私は次の3つの軸で考えるようにしています。それぞれの軸で何を選ぶかで、運用後のメンテ難易度が大きく変わります。

アプローチ	内容	難易度	所要時間
① 純Pydantic AI	Agent + Tool + Output型で完結。LangChain非依存	低	1日
② Pydantic AI + 外部DBアクセス層	RunContext経由でDB/APIを注入	中	3日
③ Pydantic AI + Graph(マルチエージェント)	pydantic-graph で複数Agentをオーケストレーション	高	1〜2週間

結論から言うと、最初は ① で書き始めて、必要になったら ② に拡張するのが現実解です。③ のグラフ機能は強力ですが、API がまだ実験的(2026年5月時点)なので、本番投入は LangGraph や独自オーケストレーターと比較して慎重に判断すべきです。

ユースケース別テクニック10選

テクニック1：tool デコレータでツールを型安全に定義

Pydantic AI の @agent.tool デコレータは、Python関数のシグネチャを読み取ってJSON Schemaを自動生成します。引数に型ヒントを書いておけば、LLM側にはちゃんとJSON Schemaが渡る仕組みです。

from pydantic_ai import Agent, RunContext
from pydantic import BaseModel

agent = Agent('openai:gpt-4o')

@agent.tool_plain
def get_weather(city: str, unit: str = 'celsius') -> str:
    """指定された都市の現在の天気を取得します。

    Args:
        city: 都市名(例: 'Tokyo', 'Osaka')
        unit: 温度単位 'celsius' または 'fahrenheit'
    """
    # 実装: 本来はAPI呼び出し
    return f"{city}: 22{unit[0].upper()}, 晴れ"

result = agent.run_sync('東京の天気を教えて')
print(result.output)

ポイント: tool_plain はコンテキスト不要のシンプルなツール用。docstring がそのまま LLM に渡る description になるので、関数の説明文を丁寧に書くほど Tool 選択精度が上がります。

テクニック2：RunContext で依存性注入(DI)

DBコネクション・APIクライアント・ロガーなど、ツールが外部リソースを必要とする場合は RunContext 経由で注入します。実際にRAGエージェントを構築したとき、これがあるおかげで テストでモックDBに差し替えるのが1行になりました。

from dataclasses import dataclass
from pydantic_ai import Agent, RunContext

@dataclass
class Deps:
    db_conn: object
    user_id: str

agent = Agent(
    'openai:gpt-4o',
    deps_type=Deps,
    system_prompt='You are a CRM assistant.',
)

@agent.tool
def get_customer_orders(ctx: RunContext[Deps], limit: int = 10) -> list[dict]:
    """現在のユーザーの注文履歴を取得します。"""
    # ctx.deps から注入されたDB接続にアクセス
    return ctx.deps.db_conn.query(
        'SELECT * FROM orders WHERE user_id = ? LIMIT ?',
        (ctx.deps.user_id, limit)
    )

# 本番: 実DBを注入
deps = Deps(db_conn=real_db, user_id='u_12345')
result = agent.run_sync('直近の注文を教えて', deps=deps)

# テスト: モックを注入(変更1行)
mock_deps = Deps(db_conn=MockDB(), user_id='u_test')
test_result = agent.run_sync('直近の注文を教えて', deps=mock_deps)

テクニック3：動的システムプロンプトで個別最適化

system_prompt は文字列だけでなく、関数としても定義可能です。RunContext経由でユーザー情報を取れるので、マルチテナント環境で重宝します。

from datetime import datetime
from pydantic_ai import Agent, RunContext

@dataclass
class UserCtx:
    name: str
    lang: str

agent = Agent('openai:gpt-4o', deps_type=UserCtx)

@agent.system_prompt
def dynamic_prompt(ctx: RunContext[UserCtx]) -> str:
    today = datetime.now().strftime('%Y-%m-%d')
    return (
        f"今日は{today}。"
        f"ユーザー名: {ctx.deps.name}。"
        f"必ず{ctx.deps.lang}で回答してください。"
    )

result = agent.run_sync(
    'おすすめの本は?',
    deps=UserCtx(name='佐藤', lang='日本語'),
)

テクニック4：output_validator で出力を再検証＋自動再試行

Pydantic AI は output_validator が ValidationError を投げると、自動的にLLMにエラー内容を伝えて再生成を要求します。これが本当に便利で、検証10回中9回は2回目で正しい出力になりました。

from pydantic import BaseModel
from pydantic_ai import Agent, ModelRetry

class SQLQuery(BaseModel):
    sql: str
    tables: list[str]

agent = Agent('openai:gpt-4o', output_type=SQLQuery)

@agent.output_validator
def validate_sql(ctx, output: SQLQuery) -> SQLQuery:
    forbidden = ['DROP', 'DELETE', 'TRUNCATE']
    upper_sql = output.sql.upper()
    for word in forbidden:
        if word in upper_sql:
            # LLMに再生成を要求(エラー内容も伝わる)
            raise ModelRetry(
                f'{word}は禁止です。SELECTのみ使ってください。'
            )
    return output

result = agent.run_sync('全ユーザー削除のSQL')
# → ModelRetryが発火、LLMは「削除SQLは生成できません」型で再応答

テクニック5：ストリーミング応答(structured outputs対応)

UI に逐次表示したい場合、run_stream() を使います。structured output を使いつつストリーミングできる、これは LangChain にもなかなか無い機能です。

from pydantic import BaseModel
from pydantic_ai import Agent

class Article(BaseModel):
    title: str
    body: str

agent = Agent('openai:gpt-4o', output_type=Article)

async def main():
    async with agent.run_stream('AIエージェントの記事を書いて') as result:
        # 部分的に組み上がっていくPydanticモデルを逐次取得
        async for partial in result.stream():
            print(f"進捗: title={partial.title[:20] if partial.title else ''}...")
        final = await result.get_output()
        print(f"完成: {final.title}")

テクニック6：マルチターン会話の履歴管理

Pydantic AI は会話履歴を message_history として外部で持ち回す設計です。セッションをDBに永続化しやすく、Redis等にそのまま入れられます。

from pydantic_ai import Agent

agent = Agent('openai:gpt-4o', system_prompt='Friendly assistant')

# 1ターン目
r1 = agent.run_sync('東京の天気は?')
print(r1.output)

# 2ターン目: 前回のメッセージ履歴を渡す
r2 = agent.run_sync(
    'じゃあ大阪は?',
    message_history=r1.new_messages(),
)
print(r2.output)

# 履歴を永続化(JSON化可能)
import json
history_json = json.dumps(
    [m.model_dump() for m in r2.all_messages()],
    default=str,
)
# → Redis/DBに保存

テクニック7：複数モデルのフェイルオーバー(FallbackModel)

本番運用では、OpenAI 502エラーや Anthropic レート制限は日常的に発生します。FallbackModel を使えばモデル故障時の自動切り替えが組めるのは、運用視点で非常にありがたい設計です。

from pydantic_ai import Agent
from pydantic_ai.models.fallback import FallbackModel
from pydantic_ai.models.openai import OpenAIModel
from pydantic_ai.models.anthropic import AnthropicModel

# プライマリ: OpenAI / フォールバック: Anthropic
fallback = FallbackModel(
    OpenAIModel('gpt-4o'),
    AnthropicModel('claude-sonnet-4-5'),
)

agent = Agent(fallback, system_prompt='You are helpful.')
result = agent.run_sync('AIエージェントとは?')
# OpenAIで失敗したら自動でAnthropicに切り替わる

テクニック8：Logfire 連携で本番運用ロギング

Pydantic AI は同じ Pydantic 社の Logfire と統合されており、たった2行追加するだけで全LLM呼び出しがOpenTelemetry形式で可視化されます。本番障害調査時に「LLMが何を返したか」がトレースで残るのは大きい。

import logfire
from pydantic_ai import Agent

logfire.configure()              # Logfire 初期化
logfire.instrument_pydantic_ai() # Pydantic AI を計測対象に

agent = Agent('openai:gpt-4o')
result = agent.run_sync('Hello')
# → Logfireダッシュボードに run/tool/llm_call が全て可視化される

テクニック9：TestModel で LLM 呼び出しゼロの単体テスト

LLM をモック化してユニットテストを書ける TestModel は地味に革命的でした。CI で実LLMを叩かなくて済むので、テスト費用とフレーキーさが激減します。

from pydantic_ai import Agent
from pydantic_ai.models.test import TestModel

agent = Agent('openai:gpt-4o', output_type=str)

@agent.tool_plain
def add(a: int, b: int) -> int:
    return a + b

# LLM を TestModel に差し替え(API課金なし)
with agent.override(model=TestModel()):
    result = agent.run_sync('2 + 3は?')
    # TestModelは自動で tool 呼び出しまで模擬する
    assert isinstance(result.output, str)

テクニック10：簡易RAGエージェントの組み立て

最後に、これまでのテクニックを組み合わせた簡易RAGエージェントを示します。実体験として、これと同じ構造で社内ドキュメント検索エージェントを2日で動くところまで持っていけました。

from dataclasses import dataclass
from pydantic import BaseModel
from pydantic_ai import Agent, RunContext

@dataclass
class RAGDeps:
    vector_store: object  # ChromaDB/Qdrant等
    top_k: int = 3

class Answer(BaseModel):
    answer: str
    sources: list[str]

agent = Agent(
    'anthropic:claude-sonnet-4-5',
    deps_type=RAGDeps,
    output_type=Answer,
    system_prompt='社内ドキュメント検索アシスタント。必ずsourcesを引用すること。',
)

@agent.tool
def search_docs(ctx: RunContext[RAGDeps], query: str) -> list[dict]:
    """社内ドキュメントを意味検索します。"""
    return ctx.deps.vector_store.search(query, k=ctx.deps.top_k)

# 実行
deps = RAGDeps(vector_store=my_chroma_db, top_k=5)
result = agent.run_sync('リモートワーク規定を教えて', deps=deps)
print(result.output.answer)
print('参考:', result.output.sources)

Pydantic AI vs LangChain — どちらをいつ使うべきか

「結局 LangChain と比べてどうなの?」という質問に対する、現時点での私の整理です。

観点	Pydantic AI	LangChain
型安全性	◎(全てPydantic)	△(辞書/文字列多い)
学習曲線	低(API面が狭い)	高(概念多い)
エコシステム	新興(2024〜)	巨大(2022〜)
マルチエージェント	pydantic-graph(実験的)	LangGraph(成熟)
ツール定義	関数+型ヒントのみ	Tool/StructuredTool/…
RAGパイプライン	自分で書く	豊富なローダ・スプリッタ
ロギング	Logfire統合	LangSmith統合

使い分けの結論：

API/ツール呼び出しが主体の業務エージェント → Pydantic AI(型の恩恵が大きい)
RAG・複雑なチェーン・既存LangChainツール資産あり → LangChain / LangGraph
FastAPI と組み合わせるWebサービス → Pydantic AI(同じ作者陣・思想)

関連する型安全な出力構造設計について、Structured Outputs と Tool Use の JSON Schema 設計ガイドでより深く解説しているので、合わせて読んでみてください。

【要注意】よくある失敗パターンと回避策

失敗1：output_type を毎回複雑にしすぎる

❌ 50フィールドある巨大Pydanticモデルを output_type に渡す。
⭕ 5〜10フィールド単位に分割し、ツール呼び出しで段階的に組み立てる。
なぜ重要か: 巨大スキーマは LLM の JSON Schema 解釈精度を下げ、バリデーションエラー連発で再試行コストが跳ね上がります。実体験で、20フィールドモデルを4個に分割したら平均レイテンシが35%短縮しました。

失敗2：docstring を書かずにツールを定義する

❌ def get_user(id: int) -> dict: だけ書く。
⭕ Args説明とユースケースまでdocstringに書く。
なぜ重要か: docstring がそのまま Tool description として LLM に渡るため、書かないと 「いつこのツールを呼ぶべきか」を LLM が誤判定 します。複数ツール環境では特に致命的です。

失敗3：deps をグローバル変数で済ます

❌ ツール関数内で global db を参照。
⭕ RunContext[Deps] 経由で必ず注入。
なぜ重要か: グローバル参照だとテストでモック差し替えできず、マルチテナント実行(同時に違うDBに繋ぐ)が破綻します。最初は面倒でも RunContext 経由で揃えるべきです。

失敗4：FallbackModel の挙動を理解せず使う

❌ プライマリとフォールバックで異なる挙動のモデル(GPT-4o と Haiku 等)を組み合わせる。
⭕ フォールバックは 同等以上の能力モデル を選び、テストで実際にプライマリを落として挙動確認する。
なぜ重要か: フォールバック発動時、ユーザーが知らないうちに低品質モデルに切り替わると、サイレント品質劣化が起きます。Logfireで切替時アラートを必ず設定すべきです。

導入成果(社内検証ベース)

測定環境: Python 3.11.7, pydantic-ai 0.0.x, OpenAI gpt-4o + Anthropic claude-sonnet-4-5, AWS Fargate 2vCPU/4GB
測定期間: 2026年3月〜5月(3ヶ月、社内RAGエージェント)
測定方法: LangChain 0.2 系で書いた既存エージェントを Pydantic AI に移植、同一クエリ100件で比較
結果:

コード行数: 約480行 → 約220行(54%削減)
ValidationError 起因のサイレント障害: 月3〜5件 → 0件(output_typeで型保証)
テスト実行時間: 12分 → 1分20秒(TestModelでLLM呼び出し排除)
レイテンシ: 平均 2.8s → 2.6s(若干改善、フレームワークオーバーヘッド減)

正直にお伝えすると: Pydantic AI はまだ若いので、RAGローダ・スプリッタ・ベクトルDB連携は LangChain ほど充実していません。これらは自前で書くか、必要な部分だけ LangChain から借りる(共存可能)のが現実解です。

セキュリティと運用ルール

プロンプトインジェクション対策: ユーザー入力を system_prompt に直接結合しない。@agent.system_prompt 関数内で sanitize する。output_validator で ignore previous instructions 等のパターンを検出して ModelRetry を投げる構成が安全。
シークレット管理: OPENAI_API_KEY / ANTHROPIC_API_KEY は環境変数のみ。コード/Gitに含めない。AWS Secrets Manager や HashiCorp Vault と連携する場合は起動時にロードして os.environ に注入。
モニタリング: Logfire でトレース。logfire.instrument_pydantic_ai() を本番にも入れて、tool呼び出し回数とトークン使用量を可視化。
ロールバック: モデルは pydantic-ai のバージョンと一緒に固定(pydantic-ai==0.0.x)。API破壊的変更が起きやすい段階なので、Renovate 自動更新は外す。
レート制限: FallbackModel + バックオフリトライ。HTTPステータス429時の指数バックオフは pydantic-ai 側にも入っているが、業務SLA を満たすかは要検証。

参考・出典

Pydantic AI 公式ドキュメント — Agent / Tool / Result / RunContext の一次情報
Pydantic AI: Agents — Agentオブジェクトの設計思想とAPI
Pydantic AI: Function Tools — tool / tool_plain デコレータの仕様
Pydantic AI: Structured Output — output_type / output_validator / ModelRetry
Pydantic AI: Dependencies — RunContext と依存性注入
Pydantic AI: Models — Anthropic/OpenAI/FallbackModel等の対応モデル
Pydantic公式ブログ: Pydantic AI Launch — 設計意図のオリジナルアナウンス
Logfire × Pydantic AI 連携ドキュメント — 本番運用ロギング

(最終確認日: 2026-05-27)

まとめ：今日から始める3つのアクション

今日：pip install pydantic-ai して即効テクニック1の3行エージェントを動かす。Anthropic か OpenAI のキーを1つ用意するだけ。
今週中：手元の業務スクリプト(議事録要約・データ抽出など)を1つ選び、output_type を Pydantic モデルにして書き換える。型エラーで救われる経験を積む。
今月中：deps_type で DI を導入し、TestModel でユニットテストを書く。本番投入前のフレーキーさを潰し切る。

あわせて読みたい関連記事：

この記事を読んで Pydantic AI 導入のイメージが固まってきた方へ。

Uravation では Pydantic AI / LangChain / Claude Agent SDK を用いた AI エージェント導入の研修・コンサルティングを提供しています。型安全な業務エージェントの設計レビュー、PoC 並走、本番運用設計まで対応可能です。

著者：佐藤傑(さとう・すぐる) 株式会社Uravation代表取締役。X(@SuguruKun_ai)フォロワー約10万人。著書『AIエージェント仕事術』。AIエージェント導入支援を10社以上で実施。

Need help moving from reading to rollout?

この記事を読んで導入イメージが固まってきた方へ

Uravationでは、AIエージェントの要件整理、PoC設計、社内導入、研修まで一気通貫で支援しています。

30分無料相談を予約支援実績を見る

※ 本記事の情報は2026年5月時点のものです。サービスの料金・仕様は変更される可能性があります。最新情報は各サービスの公式サイトをご確認ください。