概述
更新时间:2026-03-22
工作流是在百舸平台实现端到端任务编排与自动化的核心模块。旨在帮助算法工程师高效地组织、管理和执行复杂的机器学习工作流,打通从数据准备、模型开发到模型部署的全生命周期环节。
通过工作流模块,用户可以将碎片化的机器学习步骤整合为标准化的流水线,从而极大提升研发效率与模型交付的质量。
核心功能
基于DAG的可视化任务编排
工作流采用有向无环图(DAG)和基于步骤的流水线机制进行构建。在工作流中每个节点代表一个具体的任务(如数据预处理、模型训练、模型评估等),任务之间的连线则明确了任务的执行顺序和数据依赖关系。
平台提供灵活的建模方式:
- YAML方式编排:算法工程师可以使用平台提供的YAML模板、示例,通过编写配置文件自定义控制工作流的执行逻辑。
- 可视化预览:YAML配置可通过可视化界面,清晰看到任务的执行顺序、结构关系。
全场景的流水线覆盖
工作流模块能够支撑开发者在百舸平台实现模型开发运营一体化,覆盖两大核心流水线场景:
- 数据处理流水线:编排数据采集、数据探索、数据处理、数据增强以及特征工程等数据加工作业。
- 机器学习流水线:编排算法选择、模型构建、模型训练、模型评估、模型部署以及上线后的模型监控等全流程任务。
多种触发机制
依托于底层强大的工作流调度引擎,在任务触发机制上,工作流不仅支持用户手动直接触发,还支持定时触发,充分满足各类自动化生产需求。
细粒度的异构算力资源分配
在模型训练的完整工作流中,不同环节对计算资源的要求存在显著差异(例如:数据处理环节主要依赖 CPU,而模型训练环节则需要 GPU 算力)。开发者可通过为不同任务分配合理的资源,使用工作流串联任务,实现资源利用的最大化。
实验追踪与组件化复用
通过使用工作流,用户不仅可以沉淀自定义算子、任务模板,还能通过重用现有的流水线快速创建端到端解决方案,避免每次从零开始构建,大幅降低研发门槛。
评价此篇文章
