用户部署模型服务调用
更新时间:2024-08-29
概述
当前模型部署支持2种计费模式,按资源算力单元计费和按Tokens计费计费。
按算力单元计费
资源租赁限时5折优惠,活动时间:2023年09月01日-2024年12月31日。
当您在部署服务时,付费信息选择分为以下两种方式:
预付费
您可通过购买托管资源进行服务QPS扩展,详细操作可参考资源租赁使用说明。
模块 | 服务类型 | 原单价 | 折后价 |
---|---|---|---|
资源池租赁 | 私有资源池租赁 | 15,000元/月 x 1副本 x1算力单元 | 7,500元/月 x 1副本 x 1算力单元 |
资源池租赁支持自动开启/关闭续费功能,请您按需打开此开关。
私有资源池支持按照算力单元提升配置:正常询价或按照公式计算均可:
- 公式:(新配置单价- 旧配置单价)* 原订单剩余时长(大于24小时,向下取整;小于24小时,向上取整)
- 例如:剩余时间为5天时发起扩容,扩容当天不收费,只收取剩余5天的扩容费用;剩余时间为8小时时,扩容收取当天全天的费用;
后付费
当您选择的付费方式为后付费时,平台仅支持默认算力,即AI加速卡I型-单副本算力单元。
- 单算力单元原价0.52元/分钟,折后价为0.26元/分钟。
注意:购买后付费资源时,将按照分钟计费,按小时出账。使用时长低于15分钟按15分钟收费,超过15分钟按实际使用分钟数收费。
按Tokens计费
当您在部署服务时,选择部署经过平台SFT的模型,付费信息可选择服务调用量(后付费),其付费规格如下:
SFT基础模型 | 模型版本 | 折扣价 | 原价 |
---|---|---|---|
ERNIE Speed | ERNIE-Speed-8K | 输入:0.004元/千tokens 输出:0.008元/千tokens |
输入:0.012元/千tokens 输出:0.024元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0308 | 输入:0.003元/千tokens 输出:0.006元/千tokens |
输入:0.009元/千tokens 输出:0.018元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0922 | 0.008元/千tokens | 0.024元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0725 | 0.008元/千tokens | 0.024元/千tokens |
ERNIE Lite | ERNIE-Lite-4K-0704 | 0.008元/千tokens | 0.024元/千tokens |
ERNIE Lite | ERNIE-Lite-4K-0516 | 0.008元/千tokens | 0.024元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-7B | 0.004元/千tokens | 0.012元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-7B-32K | 0.004元/千tokens | 0.012元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-13B | 0.006元/千tokens | 0.018元/千tokens |
ChatGLM | chatglm2-6b | 0.004元/千tokens | 0.012元/千tokens |
ChatGLM | chatglm2-6b-32k | 0.004元/千tokens | 0.012元/千tokens |
Baichuan2 | Baichuan2-7B-Chat | 0.004元/千tokens | 0.012元/千tokens |
Baichuan2 | Baichuan2-13B-Chat | 0.006元/千tokens | 0.018元/千tokens |
SQLCoder-7B | sqlcoder-7b | 0.004元/千tokens | 0.012元/千tokens |
CodeLlama | CodeLlama-7b-Instruct | 0.004元/千tokens | 0.012元/千tokens |
BLOOMZ-7B | BLOOMZ-7B | 0.004元/千tokens | 0.012元/千tokens |
价格费用举例
私有资源池租赁时间以部署成功生效时间为准。
示例1:购买1个月预付费资源
副本数自定义设置为1,算力单元默认为1。
租赁总价格为:
1(月) x
1(单副本算力单元) x
1(副本数) x
15,000(元/月x 1副本 x 1算力单元) = 15,000 元
活动期间,租赁费用为5折,所以折后价为7,500元。