充值与计费
平台采用预付费钱包模式:先充值 USDT 到组织钱包,调用时按真实用量从余额扣费。
充值(USDT)
- 进入控制台 充值 页,创建一笔充值订单。
- 系统返回一个唯一金额和支付入口(Infini 托管的 USDT 链上收款)。
- 按提示完成链上支付。
- 链上确认后,余额自动入账,可在「充值记录」查看订单状态。
计价口径
当前按 1 USDT = 1 USD 计算,不做汇率换算。充值的链由你在支付页选择,真实到账链以回调为准。
订单状态大致流转:created → processing → completed,到账后钱包余额增加。多付的情况按平台政策处理(以充值页与订单详情说明为准)。
计费模型
每次调用的扣费分三步:
- 预冻结(hold):调用前按预估金额冻结一部分可用余额,避免并发超支。
- 结算(settle):调用完成后,按真实 token / 张数扣费。
- 释放差额:冻结多于实际的部分自动释放回可用余额。
因此「可用余额」可能在请求进行中短暂低于「总余额」,请求结束后回正。如果结算异常(网络中断、客户端断开),冻结会由后台兜底任务在一段时间后自动释放。
计价单位
| 计价单位 | 适用 | 计费方式 |
|---|---|---|
| 按 token | Chat / 文本 / embeddings | 按输入 + 输出 token 数 × 每 1M token 单价 |
| 按张 | 图像生成 | 按实际返回的图片数量计费(不是请求里的 n) |
| 任务计费 | 视频 / Midjourney / 异步图 | 按任务结算;失败 / 取消 / 过期不扣费,冻结释放 |
具体每个模型的输入价、输出价、缓存价和倍率,见控制台「模型价格」页或 模型与套餐。
缓存计费
若命中**提示缓存(prompt cache)**或平台响应缓存,缓存读取部分按 cache_read_price 计费,通常显著低于输入价。响应头会带缓存命中信息:
| 响应头 | 含义 |
|---|---|
X-TT-Cache-Status | 缓存命中状态(HIT / MISS 等) |
X-TT-Cache-Savings | 本次因缓存节省的金额 |
X-TT-Cache-Read-Tokens | 按缓存价计费的 token 数 |
余额与用量
| 控制台页面 | 看什么 |
|---|---|
| 充值 | 当前余额、充值订单、账务记录(ledger) |
| 用量 | 按时间 / 模型的 token 用量与扣费,可导出 CSV |
| 请求 | 单条调用的计费明细、错误详情(按 request id) |
余额不足时
余额不足时,调用会直接返回 402 billing_shortfall。建议:
- 给关键应用的 Key 设月额度上限,避免单应用跑空余额。
- 留意余额,提前充值。
详见 错误码与限流。