「Grokエージェントに頼んだのに、ずっと思考中のまま動かない…」
正直、これは私も経験しました。あるクライアントのワークフロー自動化プロジェクトで、Grok 4.20のマルチエージェントモードに複雑なリサーチタスクを投げたところ、UIは回り続けるスピナーを表示したまま、5分経っても10分経っても何も返ってこない。結局、強制リセットしてタスクを分割し直したら即解決しました。
この記事では、Grokエージェントが「思考中」のままループする主な原因5つと、今すぐ試せる解決策・予防のベストプラクティスを解説します。コードや設定例も含めているので、API利用者にも参考になるはずです。
AIエージェントの基本的な設計パターンについては、AIエージェント構築完全ガイドでまとめています。
Grokエージェントの「思考中」とは何が起きているのか
まず、「思考中」が表示されているとき、Grokの内部で何が起きているかを知っておきましょう。
Grokは「Think モード」や「DeepSearch」を有効にすると、回答を返す前に内部で推論ステップを生成します。Grok 4.20以降のマルチエージェント構成(Council of Four)では、4つの専門エージェント(Grok、Harper、Benjamin、Lucas)がそれぞれ独立してタスクを処理し、コンセンサスをとってから最終回答を返す仕組みです。
この「合議」プロセスが正常に機能するとき、Grokは単一モデルより高品質な回答を生成できます。しかし、いくつかの条件が重なると、このプロセスが完了しない——つまり「思考中」のままスタックする状態になります。
| 状態 | UIの表示 | 起きていること |
|---|---|---|
| 正常な推論中 | 「思考中…」+ 推論トークンが流れる | 内部ステップを生成し、収束に向かっている |
| タイムアウト直前 | スピナーが止まらない(出力なし) | エージェント間のコンセンサスが収束しない |
| ループ状態 | 同じ文字列/フレーズが繰り返し出力 | デコーディングが同じトークンを選び続けている |
| 応答放棄 | 「Unable to finish replying」エラー | 60〜120秒タイムアウトに達し、強制終了 |
これらを区別すると、取るべき対処法が変わってきます。
よくある原因5選
ループや「思考中」スタックの原因は、大きく5つに分類できます。実際の事例と合わせて見ていきましょう。
原因1:タスクが複雑すぎる(マルチエージェントのコンセンサス失敗)
Grok 4.20のマルチエージェント(Council of Four)では、4つのエージェントがそれぞれの役割で回答を生成し、最終的にコンセンサスをとります。ところが、タスクが曖昧だったり複数の矛盾する条件が含まれていると、Harper(研究役)とLucas(批評役)が対立し続けて収束しません。
コンセンサスタイムアウトは通常60〜120秒で発生します。この場合、UIには「Unable to finish replying. Please try again later or use a different model.」と表示されます。
確認ポイント: タスクに複数の「〜かつ〜でなければならない」という制約が含まれていないか。矛盾する条件を一度に与えていないか。
原因2:コンテキストウィンドウの実質的な上限
Grok 4.1以降のコンテキストウィンドウは最大2百万トークンを謳っています。しかし、マルチエージェントモードでは4つのエージェントがコンテキストを共有するため、実質的な上限はずっと低くなります。長い会話履歴や大量のドキュメントを貼り付けると、コンテキストの処理に時間がかかりすぎてタイムアウトします。
| モデル | 公称コンテキスト | マルチエージェント時の実効上限(目安) |
|---|---|---|
| Grok 4 (standard) | 128,000トークン | 32,000〜64,000トークン程度 |
| Grok 4.1 Fast | 2,000,000トークン | 500,000〜800,000トークン程度(4分割) |
| Grok Code Fast 1 | 256,000トークン | エージェントモード非対応 |
注意: 上記の実効上限はxAI公式のドキュメントに明記された数値ではなく、Grok 4.20の挙動を観察した複数のユーザー報告に基づく目安です(参照日: 2026-03-18)。
原因3:ネットワーク・サーバー側の問題
Grokはサーバー側の処理をベースにしているため、以下の条件でも「思考中」のままスタックすることがあります。
- xAIサーバーへのアクセス集中(新機能リリース直後に多発)
- ローカルのネットワーク不安定(Wi-Fi帯域幅不足)
- ブラウザのキャッシュが古い認証トークンを保持している
- セッションの期限切れ(長時間ブラウザを放置した後)
この場合、xAIの公式ステータスページ(status.x.ai)でサーバー状態を確認するのが最初のステップです。
原因4:ループ検知の失敗(デコーディングの発散)
LLMはトークンを順番に予測して生成しますが、特定の条件下(高い温度設定、矛盾したプロンプト、長い出力途中のコンテキスト)で同じトークンを繰り返す確率が高くなります。これが「でもでもでも…」や「このこのこの…」のような無限繰り返しの正体です。
正常なモデルはこれを内部の「繰り返しペナルティ」で回避しますが、Grokで稀にペナルティが正常に機能しないケースが報告されています。
原因5:X API・レート制限への到達
APIでGrokを使っている場合、レート制限(429エラー)に達するとエージェントが停止します。Grok 4.20のマルチエージェントモードは通常モードの4倍のAPIコールを生成するため、意識していないうちに制限に達することがあります。
xAI APIのレート制限はティア制度で管理されており、2026年1月1日以降の累積支出に応じてティアが上がります。現在の制限値はxAI Consoleのレート制限ページで確認できます。
# 429エラーの確認(curlの例)
# 注意: 本番環境で使用する前に、必ずテスト環境で動作確認してください。
curl -X POST "https://api.x.ai/v1/chat/completions"
-H "Content-Type: application/json"
-H "Authorization: Bearer $XAI_API_KEY"
-d '{
"model": "grok-4",
"messages": [{"role": "user", "content": "テスト"}],
"max_tokens": 10
}'
# レスポンスに "error": {"code": 429} が含まれたらレート制限到達
# X-RateLimit-Remaining ヘッダーで残り上限を確認できる
動作環境: xAI API(2026年3月現在)、curlコマンド
【要注意】よくある失敗パターンと回避策
失敗1:「思考中」のまま長時間待ち続ける
❌ スピナーが回り続けていても、「そのうち返ってくるだろう」と10分以上待つ
⭕ 2〜3分経っても進展がなければ、停止ボタン(□)を押して介入する
なぜ重要か: タイムアウトは通常60〜120秒で内部的に発生しますが、UIには反映が遅れることがあります。長時間待ってもセッションが復活することは稀です。
失敗2:同じプロンプトをそのままリトライする
❌ エラーになったプロンプトを変更せずに再送信する
⭕ 原因を特定してからプロンプトを修正する(タスク分割・制約の明確化)
なぜ重要か: 同じプロンプトで同じ失敗が繰り返されます。タスクの複雑さやコンテキスト量を減らす方向で調整しましょう。
失敗3:マルチエージェントモードを常時ONにする
❌ すべてのタスクにマルチエージェントモードを使う
⭕ シンプルな質問・短いタスクはシングルエージェントモードで十分
なぜ重要か: マルチエージェントは4倍のAPIコールを消費します。また、コンセンサスプロセスが追加されるため、単純なタスクは逆に遅くなります。
失敗4:APIで無限リトライループを実装する
❌ エラー時にすぐ再試行するループを実装し、429エラーをさらに悪化させる
⭕ 指数バックオフを実装する
import time
import anthropic # 例: xAI SDK がない場合の代替パターン
# 注意: 本番環境で使用する前に、必ずテスト環境で動作確認してください。
# 動作環境: Python 3.10+
def call_grok_with_backoff(client, messages, max_retries=5):
"""指数バックオフ付きのGrok APIコール"""
retry_delay = 1 # 初期待機秒数
for attempt in range(max_retries):
try:
response = client.chat.completions.create(
model="grok-4",
messages=messages,
max_tokens=2000,
)
return response
except Exception as e:
error_code = getattr(e, 'status_code', None)
if error_code == 429: # レート制限
wait_time = retry_delay * (2 ** attempt)
print(f"Rate limit hit. Waiting {wait_time}s before retry {attempt+1}/{max_retries}")
time.sleep(wait_time)
elif error_code in [500, 503]: # サーバーエラー
time.sleep(retry_delay * 2)
else:
raise # 回復不可能なエラーは再スロー
raise Exception("Max retries exceeded")
# 使用例
# response = call_grok_with_backoff(client, messages)
解決策・今すぐ試せる対処法
対処法1:停止してタスクを分割する
「思考中」がスタックしたら、まず停止ボタン(UIの□アイコン)を押します。次に、元のタスクを小さなステップに分割して再投入します。
# タスク分割のプロンプト設計例
# NG例(複雑すぎて失敗しやすい)
prompt_bad = """
競合他社A、B、C、Dの製品を比較し、価格・機能・サポート・ユーザーレビューを
分析した上で、我が社がどの市場セグメントに注力すべきか戦略提言してください。
また、参入するならどのタイミングが最適かも含めてください。
"""
# OK例(ステップ分割)
prompt_step1 = "競合他社A、B、Cの価格と主要機能を比較する表を作成してください。"
prompt_step2 = "前の比較表をもとに、サポート品質のユーザーレビュー傾向を分析してください。"
prompt_step3 = "分析結果をもとに、注力すべき市場セグメントを3つ挙げてください。"
# 注意: 本番環境で使用する前に、必ずテスト環境で動作確認してください。
ポイント: 1つのプロンプトで完結しようとせず、出力を次のプロンプトのインプットにする「チェーン」を意識してください。
対処法2:セッションをリセットする
ネットワーク・キャッシュ起因の場合、以下の手順を試します。
- Grokからサインアウト
- ブラウザのキャッシュとCookieをクリア(Ctrl+Shift+Delete)
- ブラウザを完全に閉じる(タブだけでなくプロセスを終了)
- 再度サインインし、新しいチャットを開始
- モバイルアプリを使っている場合は、アプリを強制終了して再起動
それでも改善しない場合は、status.x.aiでサーバー障害が発生していないか確認します。
対処法3:マルチエージェントモードを一時的にオフにする
Grok 4.20のマルチエージェント機能(Council of Four)をUIまたはAPIで無効化することで、安定性が大幅に向上します。
# xAI API でマルチエージェントモードを無効化する例
# 注意: 本番環境で使用する前に、必ずテスト環境で動作確認してください。
# 動作環境: Python 3.10+、openai SDK(xAIエンドポイント向け設定)
from openai import OpenAI
client = OpenAI(
api_key="YOUR_XAI_API_KEY",
base_url="https://api.x.ai/v1",
)
# シングルエージェントモード(安定性優先)
response = client.chat.completions.create(
model="grok-4", # grok-4-heavy ではなく標準モデルを指定
messages=[
{"role": "system", "content": "あなたはシンプルかつ的確に回答する役割です。"},
{"role": "user", "content": "タスクを明確に1つだけ記述する"}
],
max_tokens=2000,
temperature=0.7, # 高すぎる温度はループの原因になる
)
print(response.choices[0].message.content)
対処法4:プロンプトに「ループ停止ルール」を組み込む
あらかじめ「ループしたら止める」ルールをシステムプロンプトに含めておく方法です。Grokのコミュニティで報告されている実践的な予防策です。
# ループ防止のシステムプロンプト設計例
# 注意: 本番環境で使用する前に、必ずテスト環境で動作確認してください。
system_prompt = """
あなたは的確で簡潔な回答を返すアシスタントです。
重要なルール:
1. 回答が完成したら即座に終了してください。「続きますか?」は不要です
2. 同じ文章を繰り返している場合は、即座に停止してまとめを返してください
3. 回答が700文字を超えそうなら、箇条書きで要点だけ返してください
4. 情報が足りない場合は、推測せず「情報が不足しています:〇〇を教えてください」と返してください
"""
# ユーザープロンプトの設計
user_prompt = """
[タスク]: 以下のテキストを3点で要約してください
[テキスト]: {input_text}
[出力形式]: 箇条書き3点のみ、各点は50字以内
"""
対処法5:APIレート制限に達している場合
429エラーが続く場合の対処は3段階あります。
- 短期対処: 数分待つ(レート制限は時間窓でリセットされる)
- 中期対処: リクエスト間に適切なウェイトを設ける(上記の指数バックオフコードを参照)
- 長期対処: xAI Consoleでティアアップグレードを検討、またはリクエストのバッチ化でコール数を削減
予防のためのベストプラクティス
1. タスクの複雑さを意識する
Grokエージェントに投げるタスクは、「1回のターンで完結できる粒度」に分割するのが基本です。目安として、タスク説明文が200字を超えたら分割を検討してください。
2. コンテキストをこまめにリセットする
長いセッションでは会話履歴がコンテキストを圧迫します。30〜50ターンを超えたら、新しいチャットを開始して必要なコンテキストだけを再入力するほうが安定します。
3. APIではtemperatureを適切に設定する
temperatureが高すぎる(0.9以上)と、トークン選択の「ランダム性」が上がり、ループのリスクが高まります。安定性を優先するなら0.5〜0.7、創造性が必要なタスクでも0.8までを目安にしてください。
4. マルチエージェントはHeavyタスクに限定する
Council of Four(マルチエージェントモード)は、深い調査・複数の視点を必要とするタスクに適しています。単純なQ&Aや短い要約には通常モードのほうが速くて安定します。
5. ステータス確認をワークフローに組み込む
# 簡易ヘルスチェック(定期実行推奨)
# 注意: 本番環境で使用する前に、必ずテスト環境で動作確認してください。
# 動作環境: Python 3.10+
import requests
def check_grok_status():
"""xAI APIのヘルスチェック"""
url = "https://api.x.ai/v1/chat/completions"
headers = {
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
}
payload = {
"model": "grok-4",
"messages": [{"role": "user", "content": "ping"}],
"max_tokens": 5
}
try:
resp = requests.post(url, json=payload, headers=headers, timeout=15)
if resp.status_code == 200:
return "OK"
elif resp.status_code == 429:
return "RATE_LIMITED"
else:
return f"ERROR_{resp.status_code}"
except requests.Timeout:
return "TIMEOUT"
# status = check_grok_status()
# print(f"Grok API Status: {status}")
参考・出典
- Consumption and Rate Limits | xAI 公式ドキュメント — xAI(参照日: 2026-03-18)
- How to Fix Grok 4.20 Parallel Agent Error — The TAS Vibe(参照日: 2026-03-18)
- Grokが反応しない?応答なしの原因と対処法 — Tenorshare PixPretty(参照日: 2026-03-18)
- Grok (Web) Status | xAI — xAI(参照日: 2026-03-18)
- Grok model – Unrecoverable agent model looping detected — Cursor Community Forum(参照日: 2026-03-18)
まとめ:今日から始める3つのアクション
- 今日やること: 「思考中」がスタックしたら2〜3分で停止し、タスクを2〜3ステップに分割して再投入する習慣をつける
- 今週中: APIで利用しているなら指数バックオフを実装し、429エラーへの耐性をつける
- 今月中: マルチエージェントを使うタスクとシングルエージェントで十分なタスクを整理し、用途別にモードを使い分けるルールを決める
あわせて読みたい:
- AIエージェント構築完全ガイド — 設計パターンから運用まで体系的に学ぶ
- Grok 4.20 マルチエージェントアーキテクチャガイド — Council of Fourの仕組みを詳しく解説
- ChatGPT vs Grok|違いと選び方を徹底比較【2026年】
- Claude vs Grok|違いと選び方を徹底比較【2026年】
- 【2026年最新】AIエージェントツール比較|おすすめ15選
AI活用の研修・導入支援については、お問い合わせフォームからご相談ください。100社以上の企業向けAI導入支援の実績があります。
この記事はAIgent Lab編集部がお届けしました。