Gemini Flash-Lite｜$0.25の軽量AI

2026.04.07 公開 2分で読める

この記事の結論

Flash-Liteは2.5倍高速・$0.25/1M。軽量エージェントのワーカーに最適な新モデル。

GoogleがGemini 3.1 Flash-Liteを発表。従来比2.5倍の応答速度と45%の出力高速化を実現し、入力100万トークンあたり$0.25の低価格。軽量AIエージェントの新標準となる可能性を検証する。

Flash-Liteのスペック

項目	Flash-Lite	Flash	Pro
応答速度	2.5x高速	基準	0.5x
出力速度	45%高速	基準	0.3x
入力コスト	$0.25/1M	$0.50/1M	$3.00/1M
コンテキスト	1M	1M	2M

AIエージェントでの活用シーン

1. 高頻度呼び出しエージェント

ルーティング、分類、フィルタリングなど1秒以内の判断が必要な処理にFlash-Liteは最適。コストが1/12のため、大量呼び出しでも予算を抑えられる。

2. マルチエージェントのワーカー

オーケストレーターはPro/Opusクラスを使い、個別タスクを実行するワーカーエージェントにFlash-Liteを割り当てる構成。

3. リアルタイムモニタリング

ログ監視、異常検知、チャットボットの初期応答など、低レイテンシが求められる場面。

Claude Haikuとの比較

同じ軽量モデルカテゴリのClaude Haiku 4.5と比較すると、Flash-Liteはコストで優位（$0.25 vs $0.80/1M input）。一方、推論品質ではHaikuが上回る場面もあり、ユースケースで使い分けが必要。

実装例

import google.generativeai as genai

model = genai.GenerativeModel('gemini-3.1-flash-lite')
response = model.generate_content(
    "この顧客メールの感情を分析: ポジティブ/ネガティブ/ニュートラル",
    generation_config={"max_output_tokens": 10}
)
print(response.text)  # "ポジティブ"

参考文献

この記事はAIgent Lab編集部がお届けしました。

AIエージェント導入のご相談

Claude・GPT・Geminiを活用したエージェント構築をサポート。

無料相談 →

Need help moving from reading to rollout?

この記事を読んで導入イメージが固まってきた方へ

Uravationでは、AIエージェントの要件整理、PoC設計、社内導入、研修まで一気通貫で支援しています。

30分無料相談を予約支援実績を見る

※ 本記事の情報は2026年4月時点のものです。サービスの料金・仕様は変更される可能性があります。最新情報は各サービスの公式サイトをご確認ください。

Gemini Flash-Lite｜$0.25の軽量AI

Flash-Liteのスペック

AIエージェントでの活用シーン

1. 高頻度呼び出しエージェント

2. マルチエージェントのワーカー

3. リアルタイムモニタリング

Claude Haikuとの比較

実装例

参考文献

この記事を読んで導入イメージが固まってきた方へ

関連記事

AgentMon｜AIエージェント行動監視ツールの仕組みと活用法

Klient PSA Hybrid Delivery｜8AIエージェント解説

OpenAI月$20億突破｜IPOと市場変化

Flash-Liteのスペック

AIエージェントでの活用シーン

1. 高頻度呼び出しエージェント

2. マルチエージェントのワーカー

3. リアルタイムモニタリング

Claude Haikuとの比較

実装例

参考文献

あわせて読みたい

この記事を読んで導入イメージが固まってきた方へ

関連記事

AgentMon｜AIエージェント行動監視ツールの仕組みと活用法

Klient PSA Hybrid Delivery｜8AIエージェント解説

OpenAI月$20億突破｜IPOと市場変化