【2026年4月】OpenHands完全ガイド｜OSSコーディングAgent実装

2026.04.29 公開 16分で読める

この記事の結論

GitHub 70K+のOSSコーディングAgent「OpenHands」。Dockerで5分起動、LLM APIコストのみで動作。SWE-bench 53%+。セットアップからPython SDK・Devin比較まで徹底解説。

結論から言う：OpenHandsは2026年4月時点でGitHub stars 70K+を誇るOSSコーディングエージェントの最有力候補だ。Devinが月額20ドル〜のSaaS型に対し、OpenHandsは自分のLLM APIキーさえあれば無料で動く。1タスクあたりのLLMコストは$0.15〜$0.60（Claude Sonnet 4系）で、Devinの従量課金（1 ACU=約$2.25）より大幅に安く済む場合がある。

Dockerで5分セットアップ、ブラウザUIとCLIの両方で使える
SWE-bench Verifiedで53%+の解決率（Claude 4.5組み合わせ時）
v1.6（2026年3月）でPlanning Mode・Kubernetesサポートが追加

対象読者：自動コーディングツールを自社インフラで運用したい開発者・ML/AIエンジニア・DevOpsチーム

今日やること：この記事のセットアップコードをコピーして、30分以内にOpenHandsを動かす

Devinが登場した2024年春、「AIがソフトウェアエンジニアを代替する」という議論が世界中で巻き起こった。しかしDevinは月額500ドル（現在は20ドル〜）の商用SaaSだ。その3か月後にGitHubに現れたのがOpenDevin（現：OpenHands）だった。

OSSで、自分のLLMキーで動き、Dockerで隔離されたサンドボックス環境で自律的にコードを書く。2026年4月現在、同プロジェクトはAll-Hands-AI組織のもとでGitHub stars 70K+、コントリビューター500名近くまで成長している。バージョン1.6では Planning Mode と Kubernetes サポートが追加され、個人開発者から企業のCI/CD組み込みまで対応できる成熟度に達した。

本記事では、ローカルセットアップからPython SDKを使った高度な自動化、Devin・Claude Codeとの実践的な比較まで、必要なものをすべてまとめた。

OpenHandsとは何か — 旧OpenDevinから現在まで

OpenHandsは、AIエージェントがコードを書き、ターミナルコマンドを実行し、ウェブを閲覧し、GitHubにPRを送るまでを完全自律で行うOSSプラットフォームだ。コアコンセプトは「人間のソフトウェアエンジニアがやることを全部やる」こと。

元々は2024年3月にOpenDevinとして公開され、同年後半にAll-Hands-AIが法人化、プロジェクト名をOpenHandsに変更した。現在のリポジトリは github.com/OpenHands/OpenHands（旧 All-Hands-AI/OpenHands）で、Dockerイメージは docker.openhands.dev でホストされている。

アーキテクチャの概要

コンポーネント	役割	実装
Runtime Sandbox	コード実行の隔離環境	Docker コンテナ（DockerOutsideDocker構成）
Agent	LLMに基づく意思決定ループ	CodeActAgent（デフォルト）
LLM Bridge	任意のLLMへの接続	LiteLLM経由（100+モデル対応）
Microagents	ドメイン特化の知識注入	Markdownファイル（repo内 .openhands/）
Event Stream	エージェント行動の記録・再現	JSONLファイル or DB

重要なのはCodeActAgentという設計だ。LLMが単にコードを「提案」するのではなく、実際にシェルコマンドを実行し、その結果を受け取り、次のアクションを決める。このループが閉じていることで、自律的な問題解決が可能になる。

5分セットアップ — ローカル環境で動かす3つの方法

公式が推奨する順序はuv → pip → Dockerの3択だ。以下にそれぞれのコマンドを示す。

方法1：uv（最推奨・最速）

# 動作環境: macOS / Ubuntu 22.04+ / WSL2
# 前提: Python 3.12+, uv 0.11.6+

# uvのインストール（未インストールの場合）
curl -LsSf https://astral.sh/uv/install.sh | sh

# OpenHandsをインストールしてサーブ
uv tool install openhands --python 3.12
openhands serve

# GPUサポートが必要な場合
openhands serve --gpu

# 現在のディレクトリをマウントする場合
openhands serve --mount-cwd

コマンド実行後、http://localhost:3000 を開き、Settings からLLMプロバイダー（Claude / OpenAI 等）とAPIキーを設定する。

方法2：pip

# 動作環境: Python 3.12+, Docker起動済み
pip install openhands
openhands serve

方法3：Docker直接実行（インフラチーム向け）

# Docker Desktop が起動していることを確認
# macOS: 設定 → Advanced → "Allow the default Docker socket to be used" を有効化

docker run -it --rm --pull=always \
  -e AGENT_SERVER_IMAGE_REPOSITORY=ghcr.io/openhands/agent-server \
  -e AGENT_SERVER_IMAGE_TAG=1.15.0-python \
  -v /var/run/docker.sock:/var/run/docker.sock \
  -v ~/.openhands:/.openhands \
  -p 3000:3000 \
  --add-host host.docker.internal:host-gateway \
  --name openhands-app \
  docker.openhands.dev/openhands/openhands:1.6

どの方法でも http://localhost:3000 でUIが立ち上がる。Dockerはポータビリティが高く、チーム共有やCI環境への組み込みに向いている。

Python SDK で自動化する — 実装サンプル集

UIだけでなく、PythonコードからOpenHandsエージェントを呼び出せる。これがOpenHandsをパイプラインに組み込む際の核心だ。

基本パターン：タスクをエージェントに投げる

# 動作環境: Python 3.12+, pip install openhands
# 必要な環境変数: LLM_API_KEY (Anthropic / OpenAI など)

import os
from openhands.sdk import LLM, Agent, Conversation, Tool
from openhands.tools.file_editor import FileEditorTool
from openhands.tools.task_tracker import TaskTrackerTool
from openhands.tools.terminal import TerminalTool

# LLMの設定 — LiteLLM形式でモデルを指定
llm = LLM(
    model="anthropic/claude-sonnet-4-5-20250929",
    api_key=os.getenv("LLM_API_KEY"),
)

# エージェントの初期化
agent = Agent(
    llm=llm,
    tools=[
        Tool(name=TerminalTool.name),
        Tool(name=FileEditorTool.name),
        Tool(name=TaskTrackerTool.name),
    ],
)

# 会話（= タスクセッション）を作成して実行
cwd = os.getcwd()
conversation = Conversation(agent=agent, workspace=cwd)
conversation.send_message("auth.py の単体テストをpytestで書いてください。")
conversation.run()

CLIのヘッドレスモード：CI/CDパイプラインへの組み込み

# 動作環境: openhands CLI インストール済み
# LLM_API_KEY 環境変数が必要

# 単一タスクをヘッドレスで実行
openhands --headless -t "リポジトリのREADMEを日本語に翻訳してください"

# 複数のタスク指示をファイルから読み込む
openhands --headless -f tasks/sprint-tasks.md

# JSON形式で出力（CI/CDからのパース用）
openhands --headless --json -t "依存パッケージを最新版に更新してください"

Microagentによるリポジトリ固有の知識注入

# .openhands/microagents/repo.md
---
name: my-project-context
type: repo
---

このリポジトリは Django + PostgreSQL で構築された SaaS 製品です。
- テストは `pytest` で実行します: `pytest tests/ -v`
- マイグレーションは必ず `python manage.py makemigrations` の後に `migrate` します
- コードスタイル: `black` と `isort` を必ず通してください
- PRを作る前に `mypy src/` でタイプチェックしてください

このMarkdownファイルをリポジトリの .openhands/microagents/ に置くだけで、OpenHandsが自動的に読み込みプロジェクト固有のルールに従って動作する。Devinの「Playbooks」機能と同等だが、完全にOSSかつバージョン管理できる。

GitHub Actions連携：PR自動レビュー

# .github/workflows/openhands-review.yml
name: OpenHands PR Review

on:
  pull_request:
    types: [opened, synchronize]

jobs:
  agent-review:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4

      - name: Run OpenHands Agent
        run: |
          pip install openhands
          openhands --headless --json \
            -t "このPRの変更を確認し、バグ・セキュリティ問題・パフォーマンス問題があればコメントしてください" \
            > review_output.json
        env:
          LLM_API_KEY: ${{ secrets.ANTHROPIC_API_KEY }}

      - name: Post Review Comment
        run: |
          python scripts/post_github_comment.py review_output.json
        env:
          GITHUB_TOKEN: ${{ secrets.GITHUB_TOKEN }}

OpenHands vs Claude Code vs Devin — 実践比較

「どれを使えばいいか」が最も多い質問だ。結論から言えば、ユースケースと運用体制で使い分けるのが正解だ。

スペック比較表

項目	OpenHands	Claude Code	Devin
ライセンス	MIT（完全OSSe）	クローズドSaaS	クローズドSaaS
料金	LLM APIコストのみ	Max $100/月 or API従量	$20/月 + $2.25/ACU
1タスクコスト目安	$0.15〜$0.60	$0.10〜$0.80	$2〜$9（15〜60分タスク）
動作環境	セルフホスト	ローカルターミナル	クラウドSaaS
SWE-bench Verified	53%+（Claude 4.5時）	未公開（比較困難）	約55%（公式発表）
UIの有無	ブラウザUI + CLI	CLIのみ	ブラウザUI
カスタム知識注入	Microagents（MD）	CLAUDE.md	Playbooks
データプライバシー	完全自社管理可	Anthropic送信あり	Cognition送信
GitHub PR作成	ネイティブ対応	対応（要gh CLIe）	ネイティブ対応
CI/CD統合	Docker/K8s対応	Actions対応	限定的

※料金は2026年4月時点。SWE-bench Verifiedスコアはモデルバージョン・プロンプト設計によって変動する。

ユースケース別のおすすめ

状況	推奨	理由
データが社外に出せないエンタープライズ	OpenHands	完全セルフホスト、監査ログ残る
個人開発者・スタートアップ	Claude Code	セットアップ0分、ターミナル統合が自然
非技術者チームのタスク依頼	Devin	ブラウザUIが直感的、Playbooksで運用定型化
大量タスクをCI/CDで自動化	OpenHands	Docker/K8sスケール、コスト予測しやすい
即座にコードを書いてほしい（対話型）	Claude Code	ターミナルで即レスポンス

コスト試算 — 月100タスク運用した場合

「OpenHandsは本当に安いのか」を具体的に試算する。前提条件：1タスク＝中規模のバグ修正・機能追加（約30分相当の作業）。

ツール	月100タスクのコスト試算	内訳
OpenHands + Claude Sonnet 4	$15〜$60	LLM APIコストのみ（$0.15〜$0.60/タスク）
OpenHands + GPT-4o	$20〜$80	LLM APIコストのみ
Devin	$245〜$920	基本料金$20 + $2.25 × 100ACU〜400ACU
Claude Code (Maxプラン)	$100〜	Maxプラン固定費 + 超過時の従量

注意点：OpenHandsのコストにはインフラ費用（EC2/GCE等の実行環境）が含まれていない。セルフホストの場合、サーバー代が別途かかる。また、設定・メンテナンスの人件費も「隠れコスト」として考慮が必要だ。

Dockerコンテナをクラウドで常時起動する場合のインフラコスト目安

# AWS EC2 t3.medium (2vCPU, 4GB) — OpenHands推奨最小スペック
# 東京リージョン オンデマンド: 約$0.052/時間 = 約$38/月

# GCP e2-standard-2 (2vCPU, 8GB)
# 東京リージョン: 約$0.067/時間 = 約$49/月

# 月100タスクの総コスト（OpenHands + Claude Sonnet 4 + EC2 t3.medium）
# LLM: $15〜$60 + インフラ: $38 = 計$53〜$98/月
# Devinと比べると: Devin $245〜$920 vs OpenHands $53〜$98

よくある失敗パターンと回避策

失敗1：Dockerソケットのパーミッション問題

OpenHandsはDocker-outside-Docker構成で動く。Dockerソケット(/var/run/docker.sock)へのアクセス権がないと起動しない。

❌ よくある間違い：Dockerを起動せずに openhands serve を実行する

⭕ 正しいアプローチ：

# Dockerの起動確認
docker ps

# macOSの場合: Docker Desktop → 設定 → Advanced
# "Allow the default Docker socket to be used" を有効化

# Linuxの場合: ユーザーをdockerグループに追加
sudo usermod -aG docker $USER
newgrp docker

失敗2：LLMのコンテキスト超過によるタスク失敗

❌ よくある間違い：大規模リポジトリ全体の解析を1タスクで依頼する

⭕ 正しいアプローチ：タスクを分割し、Microagentで必要なコンテキストのみ注入する

# .openhands/microagents/scope.md
---
name: scope-limiter
type: repo
---

タスクを実行する際は以下のディレクトリのみを対象にしてください:
- src/api/ — APIエンドポイント
- src/models/ — データモデル
- tests/unit/ — ユニットテスト

src/legacy/ や docs/ は変更しないでください。

失敗3：Planning Modeを使わずに複雑タスクを実行する

v1.5.0で追加されたPlanning Modeを使わずに、複数ファイルにまたがる大きな機能追加を依頼すると、エージェントが迷走して途中でループする。

❌ よくある間違い：「認証機能を丸ごと実装してください」と1発で投げる

⭕ 正しいアプローチ：Planning Modeをオンにしてタスク計画を先に作らせる

# UIの場合: Settings → Agent → "Enable Planning Mode" をオン
# CLIの場合:
openhands --headless --planning-mode \
  -t "JWTベースの認証機能を実装してください。まず計画を立ててから実行してください"

FAQ

Q: OpenHandsはどのLLMでも動きますか？
A: LiteLLM経由で100以上のモデルに対応している。Claude (Anthropic)、GPT-4o (OpenAI)、Gemini (Google)、Qwen、ローカルのOllamaモデルも使える。パフォーマンスはモデルによって大きく異なり、SWE-bench Verifiedで53%+を出すにはClaude 4.5やGPT-4o相当の高性能モデルが必要だ。

Q: Devinからの移行は難しいですか？
A: DevinのPlaybooksに相当する機能がOpenHandsのMicroagentsだ。Playbooksの内容を .openhands/microagents/ 以下のMarkdownに書き直すだけで移行できる。UIの学習コストは1〜2時間程度。

Q: セキュリティ上の懸念はありますか？
A: エージェントはDockerコンテナ内で動くため、ホストシステムへの直接アクセスはない。ただし、エージェントがシェルコマンドを実行する権限を持つため、機密リポジトリで使う際は実行前の確認ステップを設けることを推奨する。Microagentの require_human_approval: true フラグでデプロイ等の破壊的操作に承認ステップを追加できる。

Q: OpenHands Cloudとセルフホストの違いは？
A: OpenHands Cloudは openhands.dev で提供されるマネージドサービスで、インフラを自分で用意しなくていい。ただし2026年4月時点ではベータ扱い（2025年11月にベータ公開発表）。セルフホストはデータを自社管理できるが、メンテナンス責任が発生する。

Q: Claude CodeとOpenHandsを使い分けるコツは？
A: インタラクティブなコーディング（リアルタイムでAIと対話しながら書く）はClaude Code、バッチ処理や夜間の自動タスク実行はOpenHandsという使い分けが実用的だ。両者は競合というより補完関係にある。

参考・出典

OpenHands GitHubリポジトリ（All-Hands-AI, 2026年4月確認）
OpenHands ローカルセットアップ公式ドキュメント（docs.openhands.dev, 2026年4月確認）
OpenHands Software Agent SDK ドキュメント（docs.openhands.dev, 2026年4月確認）
OpenHands v1.6.0 リリースノート（GitHub, 2026年3月30日）
Introducing the OpenHands Index（openhands.dev, 2026年1月28日）
SWE-bench Leaderboard（swebench.com, 2026年4月確認）

まとめ：今日から始める3つのアクション

今日：uv tool install openhands --python 3.12 && openhands serve を実行して、http://localhost:3000 を開く。ClaudeかOpenAIのAPIキーを設定し、小さなバグ修正タスクを1つ投げてみる
今週中：リポジトリに .openhands/microagents/repo.md を作成し、プロジェクト固有のルール（テストの実行方法、コーディング規約）を記述する。エージェントの挙動が格段に改善する
今月中：GitHub Actionsに組み込み、PRのレビューを自動化する。月100タスク規模になったらコスト試算を見直し、Devin・Claude Codeとのハイブリッド運用を検討する

著者プロフィール

佐藤傑（さとう・すぐる）。株式会社Uravation代表取締役。X（@SuguruKun_ai）フォロワー約10万人。著書『AIエージェント仕事術』。AIエージェントを実業務で設計・導入する実践者として、開発者向けに技術情報を発信している。

この記事を読んで導入イメージが固まってきた方へ

UravationではAIエージェント導入の研修・コンサルを行っています。

Need help moving from reading to rollout?

この記事を読んで導入イメージが固まってきた方へ

Uravationでは、AIエージェントの要件整理、PoC設計、社内導入、研修まで一気通貫で支援しています。

30分無料相談を予約支援実績を見る

※ 本記事の情報は2026年4月時点のものです。サービスの料金・仕様は変更される可能性があります。最新情報は各サービスの公式サイトをご確認ください。

【2026年4月】OpenHands完全ガイド｜OSSコーディングAgent実装

OpenHandsとは何か — 旧OpenDevinから現在まで

アーキテクチャの概要

5分セットアップ — ローカル環境で動かす3つの方法

方法1：uv（最推奨・最速）

方法2：pip

方法3：Docker直接実行（インフラチーム向け）

Python SDK で自動化する — 実装サンプル集

基本パターン：タスクをエージェントに投げる

CLIのヘッドレスモード：CI/CDパイプラインへの組み込み

Microagentによるリポジトリ固有の知識注入

GitHub Actions連携：PR自動レビュー

OpenHands vs Claude Code vs Devin — 実践比較

スペック比較表

ユースケース別のおすすめ

コスト試算 — 月100タスク運用した場合

Dockerコンテナをクラウドで常時起動する場合のインフラコスト目安

よくある失敗パターンと回避策

失敗1：Dockerソケットのパーミッション問題

失敗2：LLMのコンテキスト超過によるタスク失敗

失敗3：Planning Modeを使わずに複雑タスクを実行する

FAQ

参考・出典

まとめ：今日から始める3つのアクション

この記事を読んで導入イメージが固まってきた方へ

関連記事

【2026年4月】Pipecat完全ガイド｜音声AIエージェント実装

【2026年4月】Genkit完全ガイド｜Google製AIフレームワーク実装

【2026年4月】Agent Skills完全ガイド｜Claude実装と本番運用