トークン単価とは
トークン単価とは、生成AI APIで文章を処理する時に、入力や出力のトークン数に応じて発生する利用料金の単価です。トークンは、AIが文章を細かく区切って扱う単位のこと。人間の文字数とは一致しないため、同じ1ページの文章でも、モデルや言語によって費用感が変わることがあります。
入力、キャッシュ入力、出力で単価が分かれる
OpenAIのAPI価格表では、100万トークンあたりの価格(100万トークンは、おおよそ文庫本数冊ぶんの文章量にあたります)として、入力、キャッシュ入力、出力などを分けた掲載形式。AnthropicのClaude APIでも、入力トークン、キャッシュ関連、出力トークンの価格区分は同様です。つまり見積もりでは、送る文章の量だけでなく、AIが返す文章の量も費用に効く構造です。
たとえば社内文書を大量に読み込ませる業務では入力側が重くなり、長いレポートを生成させる業務では出力側が重くなる傾向。プロンプトキャッシュやセマンティックキャッシュは、繰り返し処理の費用を下げるための工夫として検討する選択肢です。
見積もりで見落としやすいところ
トークン単価だけを見て「このモデルは安い」と判断するのは危険です。実際の費用は、1回あたりの入力量、出力量、利用回数、失敗時の再実行、ログや検索ツールで追加される文脈で変わります。単価表は電気料金の単価であり、請求額そのものではありません。
経営判断では、推論コストを「1回答いくら」だけでなく、「1件の問い合わせ解決」「1商談の資料作成」「1社内検索の完了」など、業務単位に直して見ると現実に近づきます。従量課金のサービスでは、使われるほど価値も費用も増える構造だからです。
Topic同じ文章でもモデル変更でトークン数が変わる
Anthropicの公式ドキュメントでは、Claude Opus 4.7で導入された新しいトークナイザーが、それ以前のモデルより同じ文章を約30%多いトークンとして数えると説明しています。単価が同じでも、数え方が変われば請求の見え方は変わる点に注意。
トークン単価に関するよくある質問
- トークン単価と月額料金は何が違いますか?
- 月額料金は一定期間の利用権に対する料金です。トークン単価は、APIなどで実際に処理した入力や出力の量に応じてかかる従量課金の単価です。
- 安いモデルを選べばAI費用は下がりますか?
- 下がる場合もありますが、必ずではありません。出力が長い、再実行が多い、検索やツール利用が増える場合は、単価が低くても総額が膨らみます。
- 見積もりでは何を数えればよいですか?
- 1回あたりの入力トークン、出力トークン、利用回数、キャッシュ利用の有無、失敗時の再実行を分けて見ます。業務単位の費用に直すと判断しやすくなります。