百舸一体机搭载百舸异构计算平台,提供高效的异构资源管理、丰富的资源调度策略、全方位的故障感知与容错机制、极致的存训推一体化加速、便捷的多芯适配及业务迁移等硬核产品能力。面向政务、金融、能源、教育等行业客户,端到端提供芯片、框架、模型、应用的软硬一体解决方案,可平滑地从单机扩展至大规模集群。
百舸一体机融合了资源调度、多芯异构、训推加速等多项异构算力管理能力,实现从模型训练、推理到多角色协作的全生命周期AI任务管理。兼容市场主流大模型(DeepSeek、Llama、Qwen等),并针对软硬件深度优化,极大提升资源利用率和业务迭代效率。基础设施层,支持NVIDIA/昆仑芯等AI加速卡,兼容CentOS/Ubuntu/麒麟系统;平台组件层整合容器引擎、镜像管理、BCCL通信库、AIAK加速套件、AI组件及算力池化技术;能力中心层:提供用户权限、多形态资源调度、大规模训练任务管理、弹性模型部署及自动化运维。
提供灵活的模型托管服务,支持模型的弹性伸缩,适应不同规模业务需求
通过算子优化,显著提升模型训练和推理的速度
提供多种资源调度策略,确保资源的高效分配和使用,降低企业成本
通过容器化和轻量级部署,实现快速交付和上线,缩短业务迭代周期
· 面向已交付百舸DeepSeek一体机的客户。
· 无需重部署即可扩展异构算力资源,包括高性能存储、高性能网络
· 单机使用后,根据企业实际业务场景逐步增加资源
· 计算、网络、存储均可根据客户需求弹性扩展,相对灵活简便
支持训练推理全场景,算力采用『Intel/海光4号CPU + 百度自研的昆仑芯P800加速卡模组』,集成5大组件技术,支撑7大能力中心。深度适配DeepSeek V3&R1及蒸馏模型,提供友好的用户界面及多种部署访问方式,交付上线快,加速客户AI应用落地。
资源中心:根据任务需求智能分配算力、存储等资源
用户中心:提供自定义用户、角色方便组织管理
运维中心:提供丰富的可观测指标及多维度事件统计
训练任务:提供针对模型的训练、微调及加速能力
模型部署:提供灵活、便捷的模型部署及加速能力
联网搜索:提供轻量化联网搜索能力对接
支持训练推理全场景,算力采用『Intel + 4/8张Nvidia H20/L20 GPU卡加速卡』,集成5大组件技术,支撑7大能力中心。深度适配DeepSeek V3&R1及蒸馏模型,提供友好的用户界面及多种部署访问方式,交付上线快,加速客户AI应用落地。
资源中心:根据任务需求智能分配算力、存储等资源
用户中心:提供自定义用户、角色方便组织管理
运维中心:提供丰富的可观测指标及多维度事件统计
训练任务:提供针对模型的训练、微调及加速能力
模型部署:提供灵活、便捷的模型部署及加速能力
联网搜索:提供轻量化联网搜索能力对接