AIエージェント入門

Harvey Agents解剖|法務AIが25,000ワークフローを動かす設計

Harvey Agents解剖|法務AIが25,000ワークフローを動かす設計

この記事の結論

Harvey Agentsの法務特化RAG設計と25,000ワークフロー達成の仕組みを解剖。ナレッジソース指定・レビューテーブル・Word直接編集の実装パターンを解説します。

「法律事務所のAI導入ってどこから始めればいい?」

先日、ある法務部門のリードエンジニアからこんな相談を受けました。契約書レビュー、デューデリジェンス、コンプライアンスチェック——どの業務も「文書を読んで判断する」という繰り返しのパターンがあるにもかかわらず、汎用のAIエージェントではなかなかうまくいかない、と。

その答えの一つが、Harvey が2026年に達成した「25,000超のカスタムワークフロー」という事実に詰まっています。法務に特化したRAG設計、ナレッジソース指定、レビューテーブルの自動生成、そしてWord上での直接編集——これらを組み合わせたAgent Builderの仕組みを、この記事で実装レベルから解剖します。

この記事では、Harvey Agentsの設計パターンを読み解き、自社の法務AIエージェントを構築する際に活かせる知見を整理します。

まず試したい:Harvey Agent Builderの基本3操作

Agent Builderは「言葉でワークフローを記述する → エージェントが動く」というアーキテクチャです。コードなしで法務特化エージェントを作れますが、その背後にある設計思想が重要です。

操作1:ナレッジソースの指定

ワークフローを作る際、最初に「どの文書群を参照するか」を指定します。Harvey のAgent Builderでは、以下を知識ソースとして指定できます。

  • Vault(過去の契約書・判例ライブラリ)
  • アップロードファイル(案件ごとの文書セット)
  • Webソース(規制情報、判例データベース)

指定は自然言語で行います:

# Harvey Agent Builder 設定例(自然言語指示)
エージェント名: NDA 一次レビューエージェント

ナレッジソース:
- Vault: "NDA Templates 2024-2026" フォルダ
- アップロード: 今回のNDA案(PDF)

タスク:
1. アップロードされたNDAと社内テンプレートの差分を分析
2. リスク条項(非競争条項・損害賠償上限・管轄裁判所)を抽出
3. 各条項にリスクレベル(Low/Medium/High)を付与してレビューテーブルを生成

出力形式: Wordドキュメント(社内テンプレートに準拠)

ポイント:この「Words to Workflows」アプローチにより、法務担当者がエンジニアに依存せずエージェントを構築できます。

操作2:レビューテーブルの自動生成

Harvey Agents の核心機能の一つが、デューデリジェンスや契約レビューで使われる「レビューテーブル」の自動生成です。

従来のRAGがQAチャットに留まるのに対し、Harvey は文書を読んで構造化されたリスクサマリーを表形式で出力します。

# レビューテーブル出力例(Harvey Agent生成)
| 条項 | 内容要約 | リスクレベル | 推奨対応 |
|------|---------|------------|---------|
| 第3条 非競争条項 | 退職後2年間、競合他社での就業禁止 | High | 期間を1年に短縮交渉を推奨 |
| 第7条 損害賠償 | 上限なし(無制限) | High | 契約金額の2倍上限を追加 |
| 第12条 管轄裁判所 | ニューヨーク州法・ニューヨーク連邦裁 | Medium | 東京地方裁判所への変更を検討 |
| 第5条 機密情報 | 標準的な定義範囲 | Low | 現状維持で問題なし |

この出力はそのままWordドキュメントに書き込まれるため、弁護士は編集・コメント追加からすぐに始められます。

操作3:Agentic Word による文書全体の一括編集

Harvey の差別化機能として注目されているのが、Microsoft Word Add-In を通じた100ページ超の法的文書を単一クエリで編集するCapabilityです。

# Word Add-In を使った文書全体編集の指示例
Ask モード:
「第15条から第22条の間で、準拠法に関する条項をすべて洗い出してください」

Edit モード:
「この契約書全体の損害賠償責任を"直接損害のみ"に限定する修正を加えてください。
 既存の賠償条項はすべて洗い出し、統一的に修正してください」

通常のRAGチャットが「検索→回答」のみなのに対し、Agentic Word は文書を能動的に修正・書き換える点が大きな違いです。弁護士はWord上でリアルタイムにレビューしながら、必要箇所だけ手動修正できます。

Harvey の法務特化RAG設計:3層アーキテクチャ

Harvey が25,000ワークフロー達成に至った背景には、法務業務に最適化された独自のRAG設計があります。一般的なRAGとの違いを整理します。

第1層:多管轄ナレッジベース(200+データソース)

Harvey は2026年時点で80以上の地域固有ナレッジソースを持ち、2026年中に200のデータソースに拡張しています。これは単なるウェブ検索でなく、各法域の判例データベース・規制文書・法令集を構造化したベクトルストアとして管理しているためです。

データソース種別 件数 用途
判例データベース 多数(英米法系・大陸法系) 類似判例の自動サーフェシング
規制・法令集 80+管轄区域 コンプライアンスチェック
顧客Vault 各社固有 過去ドラフト・社内ガイドライン参照
Webソース 動的 最新の規制変更情報

第2層:テンプレート学習(”ベストアソシエイトの複製”)

Harvey の公式ブログで紹介されているコンセプトが「ベストアソシエイトのアプローチをソフトウェアで複製する」です。具体的には、過去の優れた成果物(契約書ドラフト、デューデリジェンスレポート)をエージェントに学習させることができます。

# テンプレート指定の例(概念的)
knowledge_sources = {
    "templates": [
        "M&A_DD_Template_2025_Tier1.docx",  # 最優秀パートナーが作成した標準テンプレ
        "NDA_Review_Checklist_v3.xlsx",      # 内部レビューチェックリスト
    ],
    "past_work": [
        "Project_Alpha_DD_Report.pdf",  # 高評価を受けた過去案件
        "Acquisition_NDA_Series.zip",   # 同種案件の成功事例5件
    ],
    "guidelines": "Internal_Style_Guide_2026.pdf"
}

# Workflow Agent がこれらを参照してアウトプット生成

第3層:人間監視チェックポイント

法務AIにおける最大のリスクは「エラーが気づかれないまま進む」こと。Harvey はチェックポイントをコア機能として設計しており、重要な判断は必ず弁護士がレビューするフローを強制します。

  • 自動実行タスク:文書読み取り、差分分析、テーブル生成
  • 弁護士レビュー必須タスク:リスク判定の最終承認、修正内容の確定
  • バックグラウンド実行:契約満了日モニタリング、定期コンプライアンスチェック(非同期)

25,000ワークフロー達成の実態:何を自動化しているか

Harvey が公開した事例から、実際に構築されているワークフローの類型を整理します。

デューデリジェンス自動化(GSK Stockmann事例)

フィンランドの大手法律事務所GSK Stockmannは、Harvey のエージェントを用いてデューデリジェンス分析の最大75%の時間短縮を達成しました。

# デューデリジェンスワークフローの構成(概念)
DD_Agent:
  step_1: "対象企業の全契約書をVaultから取得"
  step_2: "Change of Control条項・解除条項を全文書から抽出"
  step_3: "リスクレベル別に分類してレビューテーブル生成"
  step_4: "担当弁護士に通知(ハイリスク項目のみ)"
  step_5: "承認後、ポストクロージングチェックリストを自動生成"
  human_checkpoint: "step_4(High Risk判定の確認)"

継続モニタリングの自動化(Filip & Company事例)

Filip & Company では、週5時間の定常業務をバックグラウンドエージェントに移管しました。契約満了日の自動追跡、新規規制への適合チェックなどです。

よくある実装の落とし穴と回避策

失敗1:ナレッジソースを広げすぎる

❌ 全社ドキュメントを一括インデックス → 関係ない文書が検索ノイズになる

⭕ 案件タイプ・管轄ごとにナレッジセットを分割 → 精度が大幅に向上

理由:法務RAGはドメイン特化が命。汎用インデックスは法律用語の多義性で精度が落ちます。

失敗2:チェックポイントを省略する

❌ エージェントの判断を全自動で適用 → 誤った法的解釈が契約書に混入するリスク

⭕ High Risk フラグが立った条項は必ず弁護士レビューを介在 → 責任の所在が明確になる

なぜ重要か:法的文書における誤りのリカバリーコストは極めて高い。Harvey 自身もこれを設計思想のコアに置いています。

失敗3:Word出力を「最終成果物」と扱う

❌ エージェント生成の修正案を無検証でクライアントに提出

⭕ Wordのコメント・変更履歴機能と組み合わせ、弁護士の編集記録を残す → 監査証跡として機能

失敗4:テンプレートの更新を怠る

❌ 過去成果物を学習させたまま放置 → 古い法令・廃止条項に基づく出力が発生

⭕ 四半期ごとにナレッジソースを棚卸しし、廃止文書を除外する運用ルールを設ける

Harvey型設計を自社実装で応用する

Harvey そのものを使わずとも、この設計パターンはLangChain/LangGraph + RAG + Pythonで再現できます。

from langchain.vectorstores import Chroma
from langchain.embeddings import OpenAIEmbeddings
from langchain.schema import Document
from langchain.chat_models import ChatOpenAI
from langchain.agents import create_openai_tools_agent
from langchain.tools.retriever import create_retriever_tool

# Step 1: 法務ナレッジベースを構築(管轄ごとに分割)
def build_legal_knowledge_base(documents: list[Document], jurisdiction: str):
    """
    documents: 契約書・判例・ガイドラインのリスト
    jurisdiction: "JP", "US_NY", "EU" など管轄コード
    """
    embeddings = OpenAIEmbeddings()
    vectorstore = Chroma(
        collection_name=f"legal_kb_{jurisdiction}",
        embedding_function=embeddings
    )
    vectorstore.add_documents(documents)
    return vectorstore

# Step 2: レビューテーブル生成ツール
def create_review_table_tool(vectorstore):
    retriever = vectorstore.as_retriever(search_kwargs={"k": 10})
    return create_retriever_tool(
        retriever,
        name="legal_reviewer",
        description="法的文書から指定条項を検索し、リスクレベルを付与してテーブル形式で返す"
    )

# Step 3: 人間チェックポイント付きワークフロー
def review_contract_with_checkpoint(contract_text: str, jurisdiction: str):
    """
    本番環境で使用する前に、必ずテスト環境で動作確認してください
    """
    vectorstore = build_legal_knowledge_base(
        load_jurisdiction_docs(jurisdiction),
        jurisdiction
    )
    tool = create_review_table_tool(vectorstore)
    llm = ChatOpenAI(model="gpt-4o", temperature=0)
    agent = create_openai_tools_agent(llm, [tool], legal_review_prompt)

    result = agent.invoke({"input": contract_text})

    # High Risk 条項があれば人間レビューフラグを立てる
    if any(item["risk"] == "High" for item in result["review_table"]):
        notify_lawyer(result["review_table"], priority="URGENT")
        return {"status": "REQUIRES_HUMAN_REVIEW", "table": result["review_table"]}

    return {"status": "AUTO_APPROVED", "table": result["review_table"]}

まとめ:法務AIエージェントを設計する3つの原則

  1. 今日やること:既存のナレッジ(過去契約書・社内テンプレート)をベクトルDB化する。まずは1案件タイプから
  2. 今週中:チェックポイント設計を決める(何を自動化し、何を必ず人間がレビューするか)
  3. 今月中:バックグラウンドモニタリングのワークフローを1本構築(例:契約満了日アラート)

あわせて読みたい:


参考・出典


著者: 佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。X(@SuguruKun_ai)フォロワー10万人超。100社以上の企業向けAI研修・導入支援。著書累計3万部突破。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。

この記事を読んで導入イメージが固まってきた方へ

UravationではAIエージェント導入の研修・コンサルを行っています。

Need help moving from reading to rollout?

この記事を読んで導入イメージが固まってきた方へ

Uravationでは、AIエージェントの要件整理、PoC設計、社内導入、研修まで一気通貫で支援しています。

この記事をシェア

X Facebook LINE

※ 本記事の情報は2026年4月時点のものです。サービスの料金・仕様は変更される可能性があります。最新情報は各サービスの公式サイトをご確認ください。

関連記事