充值与计费

平台采用预付费钱包模式：先充值 USDT 到组织钱包，调用时按真实用量从余额扣费。

充值（USDT）

进入控制台充值页，创建一笔充值订单。
系统返回一个唯一金额和支付入口（Infini 托管的 USDT 链上收款）。
按提示完成链上支付。
链上确认后，余额自动入账，可在「充值记录」查看订单状态。

计价口径

当前按 1 USDT = 1 USD 计算，不做汇率换算。充值的链由你在支付页选择，真实到账链以回调为准。

订单状态大致流转：created → processing → completed，到账后钱包余额增加。多付的情况按平台政策处理（以充值页与订单详情说明为准）。

计费模型

每次调用的扣费分三步：

预冻结（hold）：调用前按预估金额冻结一部分可用余额，避免并发超支。
结算（settle）：调用完成后，按真实 token / 张数扣费。
释放差额：冻结多于实际的部分自动释放回可用余额。

因此「可用余额」可能在请求进行中短暂低于「总余额」，请求结束后回正。如果结算异常（网络中断、客户端断开），冻结会由后台兜底任务在一段时间后自动释放。

计价单位

计价单位	适用	计费方式
按 token	Chat / 文本 / embeddings	按输入 + 输出 token 数 × 每 1M token 单价
按张	图像生成	按实际返回的图片数量计费（不是请求里的 `n`）
任务计费	视频 / Midjourney / 异步图	按任务结算；失败 / 取消 / 过期不扣费，冻结释放

具体每个模型的输入价、输出价、缓存价和倍率，见控制台「模型价格」页或模型与套餐。

缓存计费

若命中**提示缓存（prompt cache）**或平台响应缓存，缓存读取部分按 cache_read_price 计费，通常显著低于输入价。响应头会带缓存命中信息：

响应头	含义
`X-TT-Cache-Status`	缓存命中状态（HIT / MISS 等）
`X-TT-Cache-Savings`	本次因缓存节省的金额
`X-TT-Cache-Read-Tokens`	按缓存价计费的 token 数

余额与用量

控制台页面	看什么
充值	当前余额、充值订单、账务记录（ledger）
用量	按时间 / 模型的 token 用量与扣费，可导出 CSV
请求	单条调用的计费明细、错误详情（按 request id）

余额不足时

余额不足时，调用会直接返回 402 billing_shortfall。建议：

给关键应用的 Key 设月额度上限，避免单应用跑空余额。
留意余额，提前充值。

详见错误码与限流。