Skip to content

充值与计费

平台采用预付费钱包模式:先充值 USDT 到组织钱包,调用时按真实用量从余额扣费。

充值(USDT)

  1. 进入控制台 充值 页,创建一笔充值订单。
  2. 系统返回一个唯一金额和支付入口(Infini 托管的 USDT 链上收款)。
  3. 按提示完成链上支付。
  4. 链上确认后,余额自动入账,可在「充值记录」查看订单状态。

计价口径

当前按 1 USDT = 1 USD 计算,不做汇率换算。充值的链由你在支付页选择,真实到账链以回调为准。

订单状态大致流转:created → processing → completed,到账后钱包余额增加。多付的情况按平台政策处理(以充值页与订单详情说明为准)。

计费模型

每次调用的扣费分三步:

  1. 预冻结(hold):调用前按预估金额冻结一部分可用余额,避免并发超支。
  2. 结算(settle):调用完成后,按真实 token / 张数扣费。
  3. 释放差额:冻结多于实际的部分自动释放回可用余额。

因此「可用余额」可能在请求进行中短暂低于「总余额」,请求结束后回正。如果结算异常(网络中断、客户端断开),冻结会由后台兜底任务在一段时间后自动释放。

计价单位

计价单位适用计费方式
按 tokenChat / 文本 / embeddings按输入 + 输出 token 数 × 每 1M token 单价
按张图像生成实际返回的图片数量计费(不是请求里的 n
任务计费视频 / Midjourney / 异步图按任务结算;失败 / 取消 / 过期不扣费,冻结释放

具体每个模型的输入价、输出价、缓存价和倍率,见控制台「模型价格」页或 模型与套餐

缓存计费

若命中**提示缓存(prompt cache)**或平台响应缓存,缓存读取部分按 cache_read_price 计费,通常显著低于输入价。响应头会带缓存命中信息:

响应头含义
X-TT-Cache-Status缓存命中状态(HIT / MISS 等)
X-TT-Cache-Savings本次因缓存节省的金额
X-TT-Cache-Read-Tokens按缓存价计费的 token 数

余额与用量

控制台页面看什么
充值当前余额、充值订单、账务记录(ledger)
用量按时间 / 模型的 token 用量与扣费,可导出 CSV
请求单条调用的计费明细、错误详情(按 request id)

余额不足时

余额不足时,调用会直接返回 402 billing_shortfall。建议:

  • 给关键应用的 Key 设月额度上限,避免单应用跑空余额。
  • 留意余额,提前充值。

详见 错误码与限流

线上网关:gateway.mindproxy.ai · 基于 VitePress 构建