TPM配额后付费
概述
千帆ModelBuilder预置推理服务支持多种灵活的计费方式,本章主要为TPM配额后付费的计费方式,其他计费方式可移步至:
按量后付费 Tokens量包预付费 TPM配额预付费
按TPM配额计费:部分预置服务支持购买配额(TPM和Tokens量包),同一时刻只能有一种生效中的配额,生效顺序为TPM > Tokens量包。TPM&RPM配额付费到期(预付费配额到期)或终止(后付费人工终止)以后,为保障服务调用的稳定性与连续性,会自动切换至Tokens按量后付费模式。根据实际购买/使用的配额时长以及单价进行收费,不同预置服务TPM配额单价不同。在配额范围内的请求,不再收取tokens用量费用。超过配额范围外的请求会失败,需要用户增购配额。针对Tokens用量计费模式速率不满足业务的场景,可以通过TPM配额计费模式支持。
计费方式介绍
TPM配额后付费:可以在TPM预付费配额的基础上,再增购TPM&RPM后付费配额,以应对短时间的峰值流量。
当您选择按照算力单元按分钟后付费的付费方式时,支持您自定义资源的是释放时间。
如果开关为关闭状态,需要您手动释放资源。如果开关状态为开启,则支持您选择资源释放的时间(精确到秒)。
TPM配额后付费支持范围
购买成功后,服务的TPM&RPM由默认值切换至购买值。(注意这里购买值和默认值不叠加,而是切换)
当前规格(后付费按小时)及计费如下所示:
服务名称 | 规格内容 | 购买规格包数量 | 价格 |
---|---|---|---|
ERNIE-4.0-Turbo-128K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥22 |
ERNIE-4.0-Turbo-8K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥25 |
ERNIE-4.0-8K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥55 |
ERNIE-3.5-8k 购买入口 | 10,000 TPM,33 RPM | 1 | ¥10 |
ERNIE-Speed-8k 购买入口 | 10,000 TPM,33 RPM | 1 | ¥5 |
ERNIE-Speed-128K 购买入口 | 10,000 TPM,2 RPM | 1 | ¥20 |
ERNIE-Speed AppBuilder 购买入口 | 10,000 TPM,33 RPM | 1 | ¥5 |
ERNIE-4.0-8K-Preview 购买入口 | 10,000 TPM,33 RPM | 1 | ¥55 |
ERNIE-4.0-8K-Preview-0518 购买入口 | 10,000 TPM,33 RPM | 1 | ¥55 |
ERNIE-3.5-8K-Preview 购买入口 | 10,000 TPM,33 RPM | 1 | ¥10 |
ERNIE-Character-8K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥5 |
ERNIE-Lite-8K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥3 |
ERNIE-Novel-8K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥55 |
支持灵活变更配额,可在已购买后付费配额的前提下,扩增TPM额度或降低TPM额度。(Tips提示:两次降配TPM额度操作至少间隔60分钟)。
对于ERNIE 3.5、ERNIE 4.0和ERNIE 4.0 Turbo等Preview接口,用户已购买tpm包的场景,触发检索的query抵扣token,搜索部分按实际触发次数单独收取额外的费用,触发检索计费0.008元/次。