ブログに戻る
コラム

日本語はトークンを食う:API料金を日本語で最適化する

FastMetal

LLM API はトークン単位で課金されますが、日本語は英語よりトークンを多く消費しがちです。この記事では、その理由とコストを抑える工夫を解説します。

なぜ日本語はトークンを食うのか

トークンは「文章を分割した単位」で、日本語はひらがなで1〜2トークン、漢字で2〜3トークン程度になりやすく、同じ意味でも英語よりトークン数が増える傾向があります。つまり、同じ処理でも日本語のほうがコストがかさみやすいのです。

日本語でコストを抑える工夫

  • プロンプトを簡潔に — 冗長な敬語や前置きを削り、要点を絞る
  • 出力の長さを指定する — 「200字以内で」など、無駄な長文を避ける
  • 軽いタスクは軽いモデルへ — 要約・分類は高速・低コストなモデルに任せる
  • 不要な文脈を渡さない — 毎回すべての履歴を送らない

残高管理も大切

日本語でコストが読みにくいときこそ、残高をコントロールできる仕組みが安心です。FastMetal は円建てのプリペイドで、チャージした残高を超える請求は発生しません。残高が少なくなればアラートメールも届きます。

単価は料金ページ、モデルの使い分けはモデルカタログを参考に、日本語のコストを上手に最適化してください。