プロンプトキャッシュとは
プロンプトキャッシュとは、AIに毎回送る長い前提部分を保存しておき、次回以降は読み直さずに再利用することで、API利用の費用と待ち時間を抑える仕組みです。毎回ゼロから資料を読ませる代わりに、読み込み済みの下準備を脇に置いて使い回すイメージ。同じ前提を何度も投げる使い方で効いてきます。
英語表記:Prompt Caching
何を再利用しているのか
AIをAPIで使うと、システムへの指示や長い社内資料、ツールの定義など、同じ前提を毎回送り直す場面が多くあります。モデルはその都度すべてを読み直すため、そこに時間と費用がかかっていました。プロンプトキャッシュは、この前提部分を処理した状態で保存し、次回は読み直しを省きます。再利用された部分の費用は、基本の約0.1倍(2026年6月時点・Anthropicの例)まで下がります。ここで保存されるのは下調べの結果であって、AIの回答そのものではありません。
得になる条件と注意点
安くなるのはキャッシュした前提部分だけ。毎回変わる質問や、新しく生成される回答には、通常どおりの料金がかかります。さらに保存は既定で5分ほどで消える短命なので、間隔をあけて使うなら効果は限られるでしょう。同じ長い前提を、短い時間に何度も投げる使い方ほど効果が大きい。自社のAPIの使い方が、繰り返しの多い形かどうかが見極めの分かれ目です。
Topicじつは初回は「割高」、使い回して元を取る
見落とされがちなのが、キャッシュへの「書き込み」はむしろ割高という点。初回の保存には基本の約1.25倍がかかります(5分の場合・2026年6月時点・Anthropicの例)。つまり1回きりなら損で、短い時間に前提を使い回すほど元が取れる損益分岐があります。「キャッシュ=必ずお得」ではなく、「同じ前提を繰り返すなら得」。先に少し多めに払う構造を知っておくと、使いどころを見極めやすいでしょう。
プロンプトキャッシュに関するよくある質問
- プロンプトキャッシュを使うと回答の精度は変わりますか?
- 基本的に変わりません。前提の読み込みを省くだけで、答えの作り方そのものは同じです。費用と速度を抑えるための仕組みで、回答の中身を良くしたり変えたりする機能ではありません。
- プロンプトキャッシュはどんな業務で効果が出ますか?
- 同じ社内資料やシステム指示、多くのツール定義など、長い前提を短時間に繰り返し送るAPI利用で効果が出やすいです。問い合わせ対応や文書処理を高頻度で回す用途と相性がよい仕組みです。
- プロンプトキャッシュの料金や条件はどこで確認できますか?
- 料金の倍率や有効時間、最低トークン数などの条件は、使うAI提供元の公式ドキュメントで確認できます。条件は時期や提供元で変わるため、導入前に最新の情報を確かめてください。