AI
TOKEN BILLING

Token计费完全指南

什么是Token/词元?大模型如何计费?如何省钱?一文讲透

WHAT IS TOKEN

什么是Token(词元)?

Token(中文常称"词元")是大模型处理文本的最小计费单位。1个Token大约对应1个英文字符或0.5-1个中文字符。大模型API按Token数量计费,分为输入Token(您发送给模型的文本)和输出Token(模型返回的文本)。

1 Token ≈
1个英文字符
如 "a", "the"
1 Token ≈
0.5-1个中文字
如 "你", "好"
100万Token ≈
约50万字中文
约一本小说
BILLING RULES

大模型计费规则详解

输入与输出分离计费

主流大模型均采用输入Token输出Token分别计价的方式。输出Token价格通常是输入Token的2-5倍,因为模型生成文本的计算量远大于理解文本。

示例:DeepSeek-V4-Flash 输入1元/百万Token,输出2元/百万Token。发送1万字中文约消耗2万输入Token(≈0.02元),模型回复5千字约消耗1万输出Token(≈0.02元),总成本≈0.04元。

缓存命中大幅省钱

DeepSeek等模型支持Prompt缓存:重复发送相同前缀文本时,缓存命中部分的Token价格降至原价的1/10甚至更低。适合客服系统、模板化内容生成等重复调用场景。

省钱技巧:将系统提示词(System Prompt)固定放在请求开头,后续调用相同提示词时自动命中缓存,输入成本降至0.1元/百万Token。

批量调用优惠更低

天鸿智算提供企业级Token优惠充值,相比各平台单独充值更省心省力。支持一个平台管理多模型成本,企业年付套餐进一步降低调用成本。

开始省钱调用大模型

天鸿智算提供DeepSeek、豆包、千问、GPT、Claude等主流模型Token优惠充值,一个Key调多模型