通用资源池 :自运维资源池,需要先创建资源池购买用于AI推理的计算资源,请参考 通用资源池 托管资源池 :免运维资源池,您无需运维和管理资源池和算力资源,由平台保障资源池稳定性,请参考 托管资源池 加速芯片 选择GPU卡型号。 实例数 1.服务的实例数量; 2.实例数量 >= 1。 服务容错 开启服务容错,资源出现异常时服务会自动重建,并隔离故障节点。
在有明确对应的其他类型的错误时(包括通用的和服务自定义的)不应该使用。
快速部署GPT-SoVITS语音合成 资源准备 可根据资源规模、稳定性、灵活性等要求按需准备轻量计算实例或通用计算资源池,用于快速部署GPT-SoVITS。 安装GPT-SoVITS 1.在 工具市场 中选择GPT-SoVITS模版,点击 部署工具 按钮; 2.根据模型开发调试需求,选择使用卡数量,至少需要选择1张卡,点击 确定 启动工具。 前置准备 准备原始音频:原始音频建议遵从如下标准。
一、机柜参数 如果您选择使用LCC产品,请确认提供的部署地点是否能够满足如下LCR物理尺寸的安装与部署、运维。 机柜尺寸 42U标准U机柜(1U=44.45mm),满足通用上架条件 尺寸:2100 x 1250 x 600mm (带门、带脚轮) 预留空间 需要IDC为机柜留出的物理空间,用于运维等操作。要求前方保留至少1200mm、后方650mm的操作空隙。
准备环境和资源 可根据资源规模、稳定性、灵活性等要求按需准备轻量计算实例或通用计算资源池,用于快速部署CosyVoice。 安装CosyVoice 在 工具市场 中选择CosyVoice模版,点击 部署工具 按钮; 选择为部署工具所需的实例规格和卡数; 完成配置后点击部署,当工具状态从创建中变为运行中,表明工具已部署成功。
一键部署Kohya_ss 微调SD模型 Kohya_ss主要用于训练图像生成模型,提供用于模型训练的WebUI可视化界面。在AI绘画场景中,您可以将经过训练的LoRA模型应用于Stable Diffusion(SD)服务,作为辅助模型,以提升SD绘画的效果。 准备环境和资源 可根据资源规模、稳定性、灵活性等要求按需准备轻量计算实例或通用计算资源池,用于快速部署Kohya_ss。
快速部署Swift微调大语言模型 准备环境和资源 进入 资源池>轻量资源,点击 添加节点 按钮,将已开通的云服务器添加到百舸平台中用于快速部署Swift。若轻量资源中已添加云服务器节点,可跳过此步骤。 安装Swift 在 轻量服务>模版市场 中选择Swift模版,点击 创建服务 按钮,使用轻量资源快速部署Swift。
快速部署opencompass评测大语言模型 准备资源 可根据资源规模、稳定性、灵活性等要求按需准备轻量计算实例或通用计算资源池,用于快速部署opencompass。 AI计算资源 部署opencompass 在 工具市场>工具模版 中选择opencompass模版,点击 部署工具 按钮,完成快速部署。 根据模型开发调试需求,选择实例类型和加速芯片设置。点击 确定 启动工具。
自定义部署服务相关接口 创建服务 描述 使用自定义镜像创建推理服务,配置启动命令、端口、流量接入、健康检查、滚动更新等策略。
创建和管理资源队列 概述 托管资源池资源队列是算力资源分配调度的单元,所有使用托管资源池算力的工作负载都需要提交到对应的资源队列中才能获得算力分配。本文将介绍如何创建和管理资源队列。 创建资源队列 登录 百舸异构计算平台AIHC控制台 。 在左侧菜单栏选择托管资源池,进入托管资源池页面,选择 资源队列 ,点击 新建资源队列 。 在创建资源队列页面,根据实际需求完成相关参数配置。