TPM配额后付费
概述
千帆ModelBuilder预置推理服务支持多种灵活的计费方式,本章主要为TPM配额后付费的计费方式,其他计费方式可移步至:
按量后付费 Tokens量包预付费 TPM配额预付费
按TPM配额计费:部分预置服务支持购买配额(TPM和Tokens量包),同一时刻只能有一种生效中的配额,生效顺序为TPM > Tokens量包。TPM&RPM配额付费到期(预付费配额到期)或终止(后付费人工终止)以后,为保障服务调用的稳定性与连续性,会自动切换至Tokens按量后付费模式。根据实际购买/使用的配额时长以及单价进行收费,不同预置服务TPM配额单价不同。在配额范围内的请求,不再收取tokens用量费用。超过配额范围外的请求会失败,需要用户增购配额。针对Tokens用量计费模式速率不满足业务的场景,可以通过TPM配额计费模式支持。
计费方式介绍
TPM配额后付费:可以在TPM预付费配额的基础上,再增购TPM&RPM后付费配额,以应对短时间的峰值流量。
当您选择按照算力单元按分钟后付费的付费方式时,支持您自定义资源的是释放时间。
如果开关为关闭状态,需要您手动释放资源。如果开关状态为开启,则支持您选择资源释放的时间(精确到秒)。
TPM配额后付费支持范围
购买成功后,服务的TPM&RPM由默认值切换至购买值。(注意这里购买值和默认值不叠加,而是切换)
当前规格(后付费按小时)及计费如下所示:
服务名称 | 规格内容 | 购买规格包数量 | 原价格 | 活动价格 |
---|---|---|---|---|
ERNIE-Character-Fiction-8K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥5 | ¥5 |
ERNIE-Tiny-8K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥1 | ¥1 |
ERNIE-4.0-Turbo-8K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥25 | ¥14 |
ERNIE-4.0-Turbo-128K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥22 | ¥14 |
ERNIE-4.0-8K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥55 | ¥27 |
ERNIE-4.0-8K-Preview 购买入口 | 10,000 TPM,33 RPM | 1 | ¥55 | ¥27 |
ERNIE-4.0-8K-Preview-0518 购买入口 | 10,000 TPM,33 RPM | 1 | ¥55 | ¥27 |
ERNIE-3.5-8k 购买入口 | 10,000 TPM,33 RPM | 1 | ¥10 | ¥0.5 |
ERNIE-3.5-8K-Preview 购买入口 | 10,000 TPM,33 RPM | 1 | ¥10 | ¥0.5 |
ERNIE-3.5-128K 购买入口 | 10,000 TPM,2 RPM | 1 | ¥40 | ¥0.5 |
ERNIE-3.5-128K-Preview 购买入口 | 10,000 TPM,2 RPM | 1 | ¥40 | ¥0.5 |
ERNIE-Speed-8k 购买入口 | 10,000 TPM,33 RPM | 1 | ¥5 | ¥0.2 |
ERNIE-Speed-128K 购买入口 | 10,000 TPM,2 RPM | 1 | ¥20 | ¥0.2 |
ERNIE-Character-8K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥5 | ¥5 |
ERNIE-Lite-8K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥3 | ¥0.12 |
ERNIE-Novel-8K 购买入口 | 10,000 TPM,33 RPM | 1 | ¥55 | ¥27 |
为让用户体验测试TPM付费,部分服务TPM配额设置活动价,购买数量不超过系统默认可购买数量上限时,均按照活动价收费(活动时间:2024年12月5日-2025年1月4日)。超过则按照原价收费,且需要通过提交工单申请更多可购买数量。
支持灵活变更配额,可在已购买后付费配额的前提下,可通过变配功能实现后付费TPM配额的升配和降配。(Tips提示:两次降配TPM额度操作至少间隔60分钟)。
对于ERNIE 3.5、ERNIE 4.0和ERNIE 4.0 Turbo等Preview接口,用户已购买tpm包的场景,触发检索的query抵扣token,搜索部分按实际触发次数单独收取额外的费用,触发检索计费0.008元/次。