用户部署模型服务调用
更新时间:2024-04-26
概述
当前模型部署支持2种计费模式,按资源部署时长计费和按部署服务的调用量计费。
按部署时长计费
资源租赁限时7折优惠,活动时间:2023年09月01日-2024年12月31日。
当您在部署服务时,付费信息选择的部署时长(预付费)。
您可通过购买托管资源进行服务QPS扩展,详细操作可参考资源租赁使用说明。
模块 | 服务类型 | 单价 |
---|---|---|
资源池租赁 | 私有资源池租赁 | 20元/时*算力单元 |
资源池租赁 | 私有资源池租赁 | 250元/天*算力单元 |
资源池租赁 | 私有资源池租赁 | 6000元/月*算力单元 |
⼩时范围:1-23;天数范围:1-29;月数范围:1-12。⼩于或⼤于当前范围,请更换其他租赁⽅式。 资源池租赁支持自动开启/关闭续费功能,请您按需打开此开关。
按服务调用量计费
当您在部署服务时,选择部署经过平台SFT的模型,付费信息可选择服务调用量(后付费),其付费规格如下:
温馨提示:自2024年5月30日起,基座模型为ERNIE-Speed的部署服务按服务调用量收费标准由输入0.005元/千tokens和输出0.005元/千tokens调整为输入0.004元/千tokens和输出0.008元/千tokens,感谢您的关注!
SFT基础模型 | 模型版本 | 折扣价 | 原价 |
---|---|---|---|
ERNIE Speed | ERNIE-Speed-8K | 0.005元/千tokens | 输入:0.012元/千tokens 输出:0.024元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0308 | 输入:0.003元/千tokens 输出:0.006元/千tokens |
输入:0.009元/千tokens 输出:0.018元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0922 | 0.008元/千tokens | 0.024元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0725 | 0.008元/千tokens | 0.024元/千tokens |
ERNIE Lite | ERNIE-Lite-4K-0704 | 0.008元/千tokens | 0.024元/千tokens |
ERNIE Lite | ERNIE-Lite-4K-0516 | 0.008元/千tokens | 0.024元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-7B | 0.004元/千tokens | 0.012元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-7B-32K | 0.004元/千tokens | 0.012元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-13B | 0.006元/千tokens | 0.018元/千tokens |
ChatGLM | chatglm2-6b | 0.004元/千tokens | 0.012元/千tokens |
ChatGLM | chatglm2-6b-32k | 0.004元/千tokens | 0.012元/千tokens |
Baichuan2 | Baichuan2-7B-Chat | 0.004元/千tokens | 0.012元/千tokens |
Baichuan2 | Baichuan2-13B-Chat | 0.006元/千tokens | 0.018元/千tokens |
SQLCoder-7B | sqlcoder-7b | 0.004元/千tokens | 0.012元/千tokens |
CodeLlama | CodeLlama-7b-Instruct | 0.004元/千tokens | 0.012元/千tokens |
BLOOMZ-7B | BLOOMZ-7B | 0.004元/千tokens | 0.012元/千tokens |
价格费用举例
私有资源池租赁时间以部署成功生效时间为准。
示例1:购买5天资源
副本数自定义设置为4,算力单元默认为2。
租赁总价格为:
5(天) x
2(单副本算力单元) x
4(副本数) x
250(元/天*算力单元) = 10000 元
活动期间,租赁费用为7折,所以折后价为7000元。