日本語はトークンを食う:API料金を日本語で最適化する
FastMetal
LLM API はトークン単位で課金されますが、日本語は英語よりトークンを多く消費しがちです。この記事では、その理由とコストを抑える工夫を解説します。
なぜ日本語はトークンを食うのか
トークンは「文章を分割した単位」で、日本語はひらがなで1〜2トークン、漢字で2〜3トークン程度になりやすく、同じ意味でも英語よりトークン数が増える傾向があります。つまり、同じ処理でも日本語のほうがコストがかさみやすいのです。
日本語でコストを抑える工夫
- プロンプトを簡潔に — 冗長な敬語や前置きを削り、要点を絞る
- 出力の長さを指定する — 「200字以内で」など、無駄な長文を避ける
- 軽いタスクは軽いモデルへ — 要約・分類は高速・低コストなモデルに任せる
- 不要な文脈を渡さない — 毎回すべての履歴を送らない
残高管理も大切
日本語でコストが読みにくいときこそ、残高をコントロールできる仕組みが安心です。FastMetal は円建てのプリペイドで、チャージした残高を超える請求は発生しません。残高が少なくなればアラートメールも届きます。