用户部署模型服务调用
更新时间:2024-11-12
概述
当前模型部署支持2种计费模式,按资源算力单元计费和按Tokens计费计费。
按算力单元计费
购买算力单元限时3折起优惠,活动时间:2024年11月13日~2024年12月31日。
当您通过购买算力单元部署服务时,付费信息选择分为以下两种方式:
预付费
预付费购买的算力单元,按月计费,购买成功后开始计时。具体价格如下:
资源类型 | 规格 | 原单价(元/月) | 折后价(元/月) |
---|---|---|---|
AI加速卡Ⅰ型 | 1个算力单元 | 15,000 | (3折后) 4,500 |
AI加速卡Ⅴ型 | 1个算力单元 | 9,000 | (3折后) 2,700 |
AI加速卡Ⅵ型 | 1个算力单元 | 9,000 | (5折后) 4,500 |
AI加速卡Ⅶ型 | 1个算力单元 | 15,000 | (5折后) 7,500 |
CPU | 1个算力单元 | 3,900 | (5折后) 1,950 |
预付费购买的算力单元支持开启/关闭自动续费功能,您可在千帆产品控制台按需设置。
使用中状态的预付费算力单元支持变配(仅升配)功能,您可在千帆产品控制台按需使用。资源变配可能会带来额外的消费,计费规则如下:
- 公式:(新配置单价- 旧配置单价)* 原订单剩余时长(大于24小时,向下取整;小于24小时,向上取整)
- 例如:剩余时间为5天时发起扩容,扩容当天不收费,只收取剩余5天的扩容费用;剩余时间为8小时时,扩容收取当天全天的费用;
后付费
后付费购买的算力单元,按分钟计费,按小时出账。使用时长小于15分钟按15分钟收费,超过15分钟按照实际使用时长收费。具体价格如下:
资源类型 | 规格 | 原单价(元/分钟) | 折后价(元/分钟) |
---|---|---|---|
AI加速卡Ⅰ型 | 1个算力单元 | 0.52 | (3折后) 0.156 |
AI加速卡Ⅴ型 | 1个算力单元 | 0.32 | (3折后) 0.096 |
AI加速卡Ⅵ型 | 1个算力单元 | 0.32 | (5折后) 0.16 |
AI加速卡Ⅶ型 | 1个算力单元 | 0.52 | (5折后) 0.26 |
CPU | 1个算力单元 | 0.17 | (5折后) 0.085 |
后付费购买的算力单元支持设置定时释放时间,默认处于关闭状态,您可在千帆产品控制台按需设置。
使用中状态的后付费算力单元支持变配(升配/降配)功能,您可在千帆产品控制台按需使用。后付费算力单元根据使用时长后付费,变配成功后,价格会根据新配置自动变更。
按Tokens计费
当您在部署服务时,选择部署经过平台SFT的模型,付费信息可选择服务调用量(后付费),其付费规格如下:
SFT基础模型 | 模型版本 | 折扣价 | 原价 |
---|---|---|---|
ERNIE Speed | ERNIE-Speed-8K | 输入:0.004元/千tokens 输出:0.008元/千tokens |
输入:0.012元/千tokens 输出:0.024元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0308 | 输入:0.003元/千tokens 输出:0.006元/千tokens |
输入:0.009元/千tokens 输出:0.018元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0922 | 0.008元/千tokens | 0.024元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0725 | 0.008元/千tokens | 0.024元/千tokens |
ERNIE Lite | ERNIE-Lite-4K-0704 | 0.008元/千tokens | 0.024元/千tokens |
ERNIE Lite | ERNIE-Lite-4K-0516 | 0.008元/千tokens | 0.024元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-7B | 0.004元/千tokens | 0.012元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-7B-32K | 0.004元/千tokens | 0.012元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-13B | 0.006元/千tokens | 0.018元/千tokens |
ChatGLM | chatglm2-6b | 0.004元/千tokens | 0.012元/千tokens |
ChatGLM | chatglm2-6b-32k | 0.004元/千tokens | 0.012元/千tokens |
Baichuan2 | Baichuan2-7B-Chat | 0.004元/千tokens | 0.012元/千tokens |
Baichuan2 | Baichuan2-13B-Chat | 0.006元/千tokens | 0.018元/千tokens |
SQLCoder-7B | sqlcoder-7b | 0.004元/千tokens | 0.012元/千tokens |
CodeLlama | CodeLlama-7b-Instruct | 0.004元/千tokens | 0.012元/千tokens |
BLOOMZ-7B | BLOOMZ-7B | 0.004元/千tokens | 0.012元/千tokens |
价格费用举例
算力单元的开始时间以服务部署成功时间为准。
示例1:预付费购买1个月的AI加速卡Ⅰ型算力单元
单副本算力单元数为2,副本数自定义为2,则最终需要购买的算力单元总数为2*2=4个,购买一个月的总价格为:
1(月) x
2(单副本算力单元) x
2(副本数) x
15,000(元/月x 1副本 x 1算力单元) = 60,000 元
活动期间,购买AI加速卡算力单元享有3折优惠,所以折后价为18,000元。