DeploymentInstance . setSpec ( small ) ; 7 // 三线选定运营商[ct,un,cm],分别是电信、联通、移动,仅支持单选, 非必需 8 natDeploymentInstance . setSubServiceProviders ( java . util
Runtime String 否 Body参数 运行语言,支持 nodejs6.11/nodejs8.4/nodejs8.5/nodejs10/nodejs12/python2/python3/java8/java8_stream/golang/php7/lua5.3/dotnetcore2.2/powershell6.2 。
8 "result": true, 9 "action": "update", 10 "details": { 11 "vpcId": "vpc-wlpbxdz8" 12 } 13 }
str 是 -o 量化后的模型权重输出路径 str 是 -quant_type 量化算法 str 是 + weight_only_int8 + smooth_quant + awq + gptq -tp 服务部署的GPU卡数 int 是 1、2、4、8 -t 指定非量化的部分存储类型
d8752367-38e8-45e4-b4c7-e53be3137ce5 5 Server: BWS 6 7 { 8 "vpcId": "vpc-verrno7p" 9 }
xflow.bj.baidubce.com 响应示例 Plain Text 复制 1 HTTP/1.1 200 2 Content-type: application/json 3 4 { 5 "total":10, 6 "executions":[ 7 { 8
port dotenv 5 6 from baidubce . bce_client_configuration import BceClientConfiguration 7 from baidubce . auth . bce_credentials import BceCredentials 8
P/1.1 2 Host: bec.bdcloudapi.com 3 Content-Type: application/json; charset=utf-8 4 Authorization: bce-auth-v1/318857a8f08b11e9845ca7e54775a0c2
quot;, // 虚机密码限制长度为8~32位字符,英文、数字和符号必须同时存在,符号仅限!
响应示例 JSON 复制 1 { 2 requestId : 448cea7e-e3a3-4638-8e1e-92fb02792694 , 3 totalCount : 1 , 4 models : [ 5 { 6 name : my-model-1 , 7 id : mo-vnufEepi , 8 initSource : UserUpload , 9 latestVersion