Tokens量包预付费
概述
千帆大模型平台预置推理服务支持多种灵活的计费方式,本章主要为Tokens量包预付费的计费方式,其他计费方式可移步至:
按量后付费 TPM配额预付费 TPM配额后付费
Tokens量包预付费:用户提前购买Tokens资源包,优先消耗Tokens资源包当中的tokens余量。购买的Tokens资源包越大,折扣越大。为保障服务调用的稳定性与连续性,Tokens资源包用完以后自动切换至Tokens按量后付费模式。ERNIE 4.0系列和ERNIE 3.5系列资源包支持同系列模型不同版本共享。
Tip:
大规格的量包提供更大的 TPM配额,共享范围内的全部预置服务的TPM配额全部提升。 服务速率限制仅在Tokens量包未耗尽前有效。存在多个量包时,服务速率限制以最大值为准。 |
计费方式介绍
定义 | 付费方式 | 适用范围 | 平滑过度策略 |
---|---|---|---|
一次性购买一定数量的tokens资源包,有效期内调用模型服务时优先抵扣资源包当中的tokens余量,tokens资源包如果到期未用完,会当做过期作废处理。 | 预付费,单价略低于按量后付费,购买tokens资源包越大,单价越低。 | 稳定调用,具有一定规模的业务体量。 | 预付费购买的Tokens量包到期或耗尽后,服务付费方式自动切换至Tokens按量后付费模式。 |
不论是Tokens用量付费还是TPM&RPM配额付费,都存在接口调用速率限制。速率限制包含QPS和TPM的形式,旨在限制单位时间段内用户访问推理API的次数和消耗的tokens数,详细说明参考千帆大模型平台流量限制说明。
Tokens量包预付费支持范围
当前包含ERNIE-4.0-8K、ERNIE-3.5-8KERNIE-4.0-Turbo-8K和ERNIE-3.5-128K四个系列预置服务支持Tokens量包预付费。
1.ERNIE-4.0-8K系列
ERNIE-4.0系列 Tokens预置服务支持购买tokens量包,优先消耗资源包,按量后付费内容可查看计费说明。生效范围如下:
ERNIE-4.0-8K、ERNIE-4.0-8K-0329、ERNIE-4.0-8K-0104、ERNIE-4.0-8K-Latest
同基座上下文长度限制相近的预置服务共用Tokens量包。新增的预置服务会自动添加至生效范围,您可在购买界面查看。
当前规格及计费如下所示:
Tokens量 | 服务速率限制 | QPS | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|---|---|
1000万 | TPM = 120K,RPM = 120 | 2 | 6个月 | ¥600 | 90% | ¥540 |
5000万 | TPM = 120K,RPM = 120 | 2 | 6个月 | ¥3,000 | 80% | ¥2,400 |
1亿 | TPM = 240K,RPM = 240 | 4 | 12个月 | ¥6,000 | 80% | ¥4,800 |
5亿 | TPM = 360K,RPM = 360 | 6 | 12个月 | ¥30,000 | 75% | ¥22,500 |
10亿 | TPM = 600K,RPM = 600 | 10 | 12个月 | ¥60,000 | 70% | ¥42,000 |
2.ERNIE-3.5-8K系列
ERNIE-3.5系列 Tokens预置服务支持购买tokens量包,优先消耗资源包,按量后付费内容可查看计费说明。生效范围如下:
ERNIE-3.5-8K-0701、ERNIE-3.5-8K-0613、ERNIE-3.5-8K、ERNIE-3.5-8K-0205、ERNIE-3.5-8K-0329
同基座上下文长度限制相近的预置服务共用Tokens量包。新增的预置服务会自动添加至生效范围,您可在购买界面查看。
当前规格及计费如下所示:
Tokens量 | 服务速率限制 | QPS | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|---|---|
5,000万 | TPM = 300K, RPM = 300 | 5 | 6个月 | ¥300 | 92% | ¥276 |
1亿 | TPM = 300K, RPM = 300 | 5 | 12个月 | ¥600 | 90% | ¥540 |
5亿 | TPM = 300K, RPM = 300 | 5 | 12个月 | ¥3,000 | 80% | ¥2,400 |
10亿 | TPM = 480K, RPM = 480 | 8 | 12个月 | ¥6,000 | 80% | ¥4,800 |
50亿 | TPM = 960K, RPM = 960 | 16 | 12个月 | ¥30,000 | 75% | ¥22,500 |
100亿 | TPM = 1,200K, RPM = 1,200 | 20 | 12个月 | ¥60,000 | 70% | ¥42,000 |
3.ERNIE-4.0-Turbo-8K系列
ERNIE-4.0-Turbo-8K系列 Tokens预置服务支持购买tokens量包,优先消耗资源包,按量后付费内容可查看计费说明。生效范围如下:
ERNIE-4.0-Turbo-8K
同基座上下文长度限制相近的预置服务共用Tokens量包。新增的预置服务会自动添加至生效范围,您可在购买界面查看。
当前规格及计费如下所示:
Tokens量 | 服务速率限制 | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|---|
1,000万 | TPM = 120K, RPM = 120 | 6个月 | ¥375 | 90% | ¥337.5 |
5,000万 | TPM = 120K, RPM = 120 | 6个月 | ¥1,875 | 80% | ¥1,500 |
1亿 | TPM = 240K, RPM = 240 | 12个月 | ¥3,750 | 80% | ¥3,000 |
5亿 | TPM = 360K, RPM = 360 | 12个月 | ¥18,750 | 75% | ¥14,062.5 |
10亿 | TPM = 600K, RPM = 600 | 12个月 | ¥37,500 | 70% | ¥26,250 |
4.ERNIE-3.5-128K系列
ERNIE-3.5-128K系列 Tokens预置服务支持购买tokens量包,优先消耗资源包,按量后付费内容可查看计费说明。生效范围如下:
ERNIE-3.5-128K
当前规格及计费如下所示:
Tokens量 | 服务速率限制 | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|---|
1亿 | TPM = 400K, RPM = 5K | 12个月 | ¥945 | 90% | ¥850.5 |
5亿 | TPM = 400K, RPM = 5K | 12个月 | ¥4,275 | 80% | ¥3,780 |
10亿 | TPM = 800K, RPM = 5K | 12个月 | ¥9,450 | 80% | ¥7,560 |
50亿 | TPM = 4000K, RPM = 5K | 12个月 | ¥42,750 | 75% | ¥35,437.5 |