Tokens量包预付费
概述
千帆ModelBuilder预置推理服务支持多种灵活的计费方式,本章主要为Tokens量包预付费的计费方式,其他计费方式可移步至:
按量后付费 TPM配额预付费 TPM配额后付费
Tokens量包预付费:用户提前购买Tokens资源包,优先消耗Tokens资源包当中的tokens余量。购买的Tokens资源包越大,折扣越大。为保障服务调用的稳定性与连续性,Tokens资源包用完以后自动切换至Tokens按量后付费模式。
Tip:
大规格的量包提供更大的 TPM配额,共享范围内的全部预置服务的TPM配额全部提升。 服务速率限制仅在Tokens量包未耗尽前有效。存在多个量包时,服务速率限制以最大值为准。 |
计费方式介绍
定义 | 付费方式 | 适用范围 | 平滑过度策略 |
---|---|---|---|
一次性购买一定数量的tokens资源包,有效期内调用模型服务时优先抵扣资源包当中的tokens余量,tokens资源包如果到期未用完,会当做过期作废处理。 | 预付费,单价略低于按量后付费,购买tokens资源包越大,单价越低。 | 稳定调用,具有一定规模的业务体量。 | 预付费购买的Tokens量包到期或耗尽后,服务付费方式自动切换至Tokens按量后付费模式。 |
不论是Tokens用量付费还是TPM&RPM配额付费,都存在接口调用速率限制。速率限制包含QPS和TPM的形式,旨在限制单位时间段内用户访问推理API的次数和消耗的tokens数,详细说明参考千帆ModelBuilder流量限制说明。
Tokens量包预付费支持范围
当前支持订购Tokens量包预付费的预置服务范围,您可查看右侧导航目录。
1.ERNIE-4.0-8K系列
ERNIE-4.0系列 Tokens预置服务支持购买tokens量包,优先消耗资源包,按量后付费内容可查看计费说明。
同基座上下文长度限制相近的预置服务共用Tokens量包。具体生效范围以购买界面为准。
当前规格及计费如下所示:
Tokens量 | 服务速率限制 | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|---|
1000万 | TPM = 800K,RPM = 10K | 6个月 | ¥70 | 90% | ¥63 |
5000万 | TPM = 800K,RPM = 10K | 6个月 | ¥350 | 80% | ¥280 |
1亿 | TPM = 1040K,RPM = 10K | 12个月 | ¥700 | 80% | ¥560 |
5亿 | TPM = 5200K,RPM = 10K | 12个月 | ¥3500 | 75% | ¥2625 |
10亿 | TPM = 10400K,RPM = 10K | 12个月 | ¥7000 | 70% | ¥4900 |
2.ERNIE-3.5-8K系列
ERNIE-3.5系列 Tokens预置服务支持购买tokens量包,优先消耗资源包,按量后付费内容可查看计费说明。
同基座上下文长度限制相近的预置服务共用Tokens量包。具体生效范围以购买界面为准。
当前规格及计费如下所示:
Tokens量 | 服务速率限制 | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|---|
5,000万 | TPM = 800K, RPM = 10K | 6个月 | ¥55 | 92% | ¥50.6 |
1亿 | TPM = 800K, RPM = 10K | 12个月 | ¥110 | 90% | ¥99 |
5亿 | TPM = 800K, RPM = 10K | 12个月 | ¥550 | 80% | ¥440 |
10亿 | TPM =1040K,RPM = 10K | 12个月 | ¥1100 | 80% | ¥880 |
50亿 | TPM = 5200K,RPM = 10K | 12个月 | ¥5,500 | 75% | ¥4,125 |
100亿 | TPM =10400K,RPM = 10K | 12个月 | ¥11,000 | 70% | ¥7,700 |
3.ERNIE-4.0-Turbo-8K系列
ERNIE-4.0-Turbo-8K系列 Tokens预置服务支持购买tokens量包,优先消耗资源包,按量后付费内容可查看计费说明。
同基座上下文长度限制相近的预置服务共用Tokens量包。具体生效范围以购买界面为准。
当前规格及计费如下所示:
Tokens量 | 服务速率限制 | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|---|
1,000万 | TPM = 800K, RPM = 10K | 6个月 | ¥45 | 90% | ¥40.5 |
5,000万 | TPM = 800K, RPM = 10K | 6个月 | ¥225 | 80% | ¥180 |
1亿 | TPM = 1040K, RPM = 10K | 12个月 | ¥450 | 80% | ¥360 |
5亿 | TPM = 5200K, RPM = 10K | 12个月 | ¥2250 | 75% | ¥1687.5 |
10亿 | TPM = 10400K, RPM = 10K | 12个月 | ¥4500 | 70% | ¥3150 |
4.ERNIE-3.5-128K系列
ERNIE-3.5-128K系列 Tokens预置服务支持购买tokens量包,优先消耗资源包,按量后付费内容可查看计费说明。
具体生效范围以购买界面为准。
当前规格及计费如下所示:
Tokens量 | 服务速率限制 | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|---|
1亿 | TPM = 400K, RPM = 5K | 12个月 | ¥110 | 90% | ¥99 |
5亿 | TPM = 400K, RPM = 5K | 12个月 | ¥550 | 80% | ¥440 |
10亿 | TPM = 800K, RPM = 5K | 12个月 | ¥1,100 | 80% | ¥880 |
50亿 | TPM = 4000K, RPM = 5K | 12个月 | ¥5,500 | 75% | ¥4,125 |
5.ERNIE-Lite-Pro-128K系列
ERNIE-Lite-Pro-128K系列 Tokens预置服务支持购买tokens量包,优先消耗资源包,按量后付费内容可查看计费说明。
具体生效范围以购买界面为准。
当前规格及计费如下所示:
Tokens量 | 服务速率限制 | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|---|
1亿 | TPM = 800K, RPM = 10K | 12个月 | ¥25 | 90% | ¥22.5 |
10亿 | TPM = 800K, RPM = 10K | 12个月 | ¥250 | 85% | ¥212.5 |
50亿 | TPM = 800K, RPM = 10K | 12个月 | ¥1,250 | 80% | ¥1,000 |
6.ERNIE-Speed-Pro-128K系列
EERNIE-Speed-Pro-128K系列 Tokens预置服务支持购买tokens量包,优先消耗资源包,按量后付费内容可查看计费说明。
具体生效范围以购买界面为准。
当前规格及计费如下所示:
Tokens量 | 服务速率限制 | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|---|
1亿 | TPM = 800K, RPM = 10K | 12个月 | ¥37.5 | 90% | ¥33.75 |
10亿 | TPM = 800K, RPM = 10K | 12个月 | ¥375 | 85% | ¥318.75 |
50亿 | TPM = 800K, RPM = 10K | 12个月 | ¥1,875 | 80% | ¥1500 |
7.ERNIE-4.0-Turbo-128K系列
ERNIE-4.0-Turbo-128K系列 Tokens预置服务支持购买tokens量包,优先消耗资源包,按量后付费内容可查看计费说明。
具体生效范围以购买界面为准。
当前规格及计费如下所示:
Tokens量 | 服务速率限制 | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|---|
1亿 | TPM = 400K, RPM = 5K | 12个月 | ¥450 | 90% | ¥405 |
5亿 | TPM = 400K, RPM = 5K | 12个月 | ¥2250 | 80% | ¥1800 |
10亿 | TPM = 800K, RPM = 5K | 12个月 | ¥4500 | 80% | ¥3600 |
搜索增强量包
搜索增强支持使用量包。使用ERNIE-4.0-8K、ERNIE-3.5-8K、ERNIE-4.0-Turbo-8K、ERNIE-3.5-128K系列预置服务触发搜索增强时,如已购买搜索增强量包,则会优先抵扣量包,量包耗尽或过期后恢复至按次计费。
当前规格及计费如下所示:
次数 | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|
10000次 | 6个月 | ¥40 | 95% | ¥38 |
50000次 | 6个月 | ¥200 | 95% | ¥190 |