已创建一个BCC实例(建议配置不低于2个CPU核、4 GiB内存)。且为PFS POSIX客户端支持的操作系统(详见下表)。
CPU总量 integer totalDisk 磁盘总量 integer totalGpu GPU总量 integer totalMem 内存总量 integer totalPods POD总数 integer 错误码 请参照 错误返回 章节的内容。
6271C string gpu gpu数量 integer gpuModel gpu型号 string memory 内存数量 integer 错误码 请参照 错误返回 章节的内容。
说明:每种规格都有对应的CPU核数、内存、最大本地磁盘和最大连接数。
请求示例 更新资源配置 更新类型值为resource,表示更新虚机配置,包括CPU、内存、DNS、带宽、网卡、IP地址类型、数据盘。 仅修改带宽时不会导致虚机重启,其余情况默认均会导致虚机重启。
具体落实的时候是内核使用 CPU 先将数据拷贝到内存里,GPU 使用数据的时候再拷贝到显存中。硬件厂商如 NVIDIA 在探索的一个优化是让 GPU 直接去读取存储系统,从而减少 CPU 和 GPU 间的这一次拷贝开销,同时降低 CPU 使用率。这个技术叫 GPU Direct Sto rag e(GDS),如果能够支持它的话,能够让 GPU 训练在数据读写速度方面有更好的表现。
选填 ,默认值:不限;设置开发机占用的最多CPU核数 内存 选填 ,默认值:不限;设置开发机占用的最大内存大小 共享内存 选填 ,默认值10Gi,一般使用默认值即可,如业务有额外需求,可以按需修改 共享内存(shared memory)用于Linux中不同进程之间数据交换和共享,以提高应用程序的性能和效率。
CPU使用率 % AppId UsageMemoryInBytes 内存使用量 Bytes AppId WriteInBytes 磁盘写IO使用量 Bytes AppId
算法 含义 适用场景 缺点 支持距离算法 linear 线性计算所有向量数据 召回率100% 查询时间与数据量成正比 通常用于小数据量场景或效果对照 大数据量下效率较低 查询大量消耗cpu 欧式距离(l2) 余弦距离(cosine) 内积(innerproduct) hnsw 基于hnsw算法对数据进行近似计算 单机数据量小 对召回率要求高 对查询速度要求高 全内存 消耗内存大 欧式距离(l2) 余弦距离
请求参数 参数名称 参数类型 是否必选 参数位置 描述 version Integer 是 URL参数 API版本号 instanceId String 是 URL参数 实例ID cpuCount Integer 是 RequestBody参数 CPU核数,最小值是1 memoryCapacity Integer 是 RequestBody参数 内存大小,单位GB。