算子任务使用手册
更新时间:2026-07-03
本文档用于指导开发者在百度胜算平台完成自定义算子全流程开发,包含开发机环境准备、算子开发、算子上传、本地执行全套操作,适用于自定义业务算子开发、迭代更新、版本维护场景。
创建开发机
- 登录百度胜算控制台,在选中的工作空间操作列单击打开按钮,进入空间内。
- 侧边导航依次单击数据连接与集成>开发机>创建。

- 下文仅介绍关键配置步骤,需要选择官方镜像中的Ray镜像,并且需要输入链接开发机的 ssh 公钥。

- 创建完成后,通过登录指令获取 ssh 命令.在 vscode 中通过 ssh 远程服务进行远程开发。

算子开发
算子开发可参见百度胜算自定义算子开发实践教程文档通过自定义算子实现第三方模型服务调用、通过自定义算子实现对本地模型调用。
算子上传
您可通过平台内置命令行工具快速创建自定义算子,无需手动配置繁杂元数据。
- 登录运行中开发机终端,执行databuilder operator create命令直接创建算子;
- 必填修改项:根据实际业务修改脚本内
catalog、schema等算子元数据信息; - 执行完成之后可以在相应的元数据看到算子,代表算子创建完成。


- 参考脚本:(为了信息简洁,执行命令封装到附件中的脚本了。相关命令也可以直接在命令行中执行)
- 创建成功之后可以查看算子信息:

- 修改算子:



- 算子文件上传,需要修改为 whl 文件 真实地址,进行上传。

- 修改完成之后进行版本上传

- 获取到真实的保存地址
- 算子版本创建,修改脚本中的storageLocation,设置为第四步获取的地址。



- 算子版本获取:

- 算子版本修改:

- 算子版本删除:
- 算子删除:
如果已有算子,没有算子版本,只需要进行第四步和第五步即可,若已经有了算子版本,只想修改storageLocation,可以通过增加第七步json中的 storageLocation字段,执行即可。
本地执行
算子上传及版本配置全部完成后,可通过本地代码生成能力进行离线调试,验证算子逻辑可用性。
- 需要获取执行工作流的执行任务的task.json,入口如下图所示:

- 获取完成之后,创建一个文件 task.json,将内容放到这个文件中,获取完成之后执行:
Plain Text
1 databuilder dataflow codegen --json-file task.json --output-dir test
- 其中test为生成执行脚本的目录,若不存在,会直接创建,然后执行相应的命令即可。

评价此篇文章
