概览
更新时间:2026-05-25
什么是工作流
工作流模块是百度胜算操作系统的“任务调度与编排引擎”,负责将分散的数据集成、清洗加工、模型训练及推理等原子任务,编排为有序、自动化执行的业务流程。它提供了一个可视化的 DAG(有向无环图)工作流定义环境,支持跨引擎(Spark, Ray, SQL 等)的任务混合编排,确保复杂的数据与 AI 业务逻辑能够按照预定的依赖关系和时间策略稳定运行。
功能特性
- 可视化 DAG 编排:拖拽式画布配置任务、连线设置依赖,零代码编排复杂流程。
- 多引擎混合调度:兼容 SQL、Spark、Flink、Ray等任务混编。
- 丰富调度策略:支持定时、依赖、事件、手动、API 多种触发方式。
- 运维监控能力:流程运行日志、任务状态、失败重试、告警通知。
工作流类型对比
| 对比纬度 | 在线工作流 | 离线工作流 |
|---|---|---|
| 核心定位 | 服务化常驻模式、同步即时响应、面向高频请求式在线调用场景、非流式实时处理 | 大批量、非实时、定时批量加工 |
| 数据形态 | 单次请求传入的结构化参数/JSON数据、实时交互数据 | 离线文件、全量数据表、历史批量数据 |
| 触发方式 | 事件触发、数据到达即时执行、接口实时调用 | 周期定时、手动触发、上游依赖调度 |
| 资源占用 | 常驻集群、长期占用资源 | 任务跑完即释放资源、错峰调度 |
| 适用场景 | 在线视频识别、实时风控 | 数据入仓、清洗建模、批量特征加工 |
| 集成组件 | 仅支持算子任务组件进行编辑 | 所以组件均支持 |
评价此篇文章
