基于模板微调openpi-pi0.5模型

更新时间：2026-07-13

π0.5（Pi0.5）是Physical Intelligence（PI）公司推出的新一代视觉-语言-动作（Vision-Language-Action, VLA）模型，它在π0的基础上进行了显著升级，核心目标是提升机器人在开放世界环境中的泛化能力。它能够使机器人在从未见过的家庭环境中执行复杂的多步骤任务，例如清洁厨房或整理卧室

目前百舸异构计算平台提供了π0.5的训练模版，内置训练代码和镜像，您可以在平台分布式训练模块中，快速发起训练。

前置条件

算力和存储资源准备

算力资源

下表给出了不同模型在百舸默认参数和数据集的情况下，训练所依赖的最低配置：

模型名称	训练方式	训练资源配置
openpi/π0.5	Finetune	H800/A800*8卡

存储资源

为保证训练的性能，推荐使用并行文件存储PFS。

数据准备

数据集准备

可使用官方数据集：https://huggingface.co/datasets/openvla/modified_libero_rlds

百舸平台已经在对象存储BOS中预置上述训练数据集。您可以从对应地域的BOS路径中下载数据。请参考下载百舸平台预置的公共数据到PFS

Plain Text

1bos:/aihc-rdw-bj/openpi/pi0-fast/data/modified_libero_rlds

数据转换为LeRobot dataset

将自定义的数据集转换为LeRobot dataset。可以使用官方脚本进行转换。

百舸平台已经在对象存储BOS中预置转换后数据集，您可以从对应地域的BOS路径中下载数据.

Plain Text

1bos:/aihc-rdw-bj/openpi/pi0-fast/data/libero

准备数据映射文件和训练配置文件（可选）

如需要使用自定义的数据集微调模型，需要重新定义数据处理和训练的配置。以下Libero 数据集作为示例，您可以针对自己的数据集进行修改

定义从 Libero 环境到模型的数据映射的配置，示例参考，如需要自定义，可以在训练代码中指定DATA_CONFIG文件路径替换。
定义微调超参数、数据配置和权重加载器配置。示例参考，如需要自定义，可以在训练代码中指定TRAINING_CONFIG文件即可

模型权重& tokenizer准备

百舸平台已经在对象存储BOS中预置模型权重,您可以从对应地域的BOS路径中下载数据。

openpi/π0.5 模型权重

Plain Text

1bos:/aihc-models-bj/openpi/pi0.5/ckpt/pi05_base

Tokenizer：

Plain Text

1bos:/aihc-models-bj/openpi/pi0.5/big_vision/paligemma_tokenizer.model

进行训练

登录百舸异构计算平台AIHC控制台。
进入 分布式训练 列表页面，点击创建任务，填写任务配置信息：
- 基础信息
  - 任务名称：输入您的自定义任务名称
  - 资源池&队列：选择已创建的资源池和队列
  - 优先级：默认中优先级，无需更改
  - 训练框架：选择Pytorch
  - 任务创建方式：选择基于开源模型训练模版创建
  - 模型：选择对应的模型和训练方式
- 环境配置
  - 镜像地址：无需更改，平台默认提供
  - 执行命令：系统已经默认训练的启动参数，需要替换DATA_PATH、TRAINING_CONFIG等配置信息
    - DATA_PATH：数据集的路径
    - DATA_CONFIG：如使用上述平台提供的libero数据集，这里则不填写，使用默认的DATA_CONFIG。如自定义数据集，则需要配置此文件
    - TRAINING_CONFIG：如使用平台预置的数据集、训练配置等，无需填写，使用默认的TRAINING_CONFIG；如需要自定义更多的训练参数等配置，则需要配置此文件
    - TRAINING_CONFIG_NAME：如使用上述平台提供的libero数据集，则无需填写；如自定义数据集，则需要填写
    - PALIGEMMA_TOKENIZER_PATH：模型的tokenizer路径
    - REPO_ID：如使用上述平台提供的libero数据集，则无需填写；如自定义数据集，则需要自定义填写
    - BASE_CHECKPOINT_LOAD_PATH：模型原始权重的路径
    - CHECKPOINT_SAVE_BASEDIR：模型训练后权重的保存路径
    - EXP_NAME：会拼接到CHECKPOINT_SAVE_BASEDIR后作为子目录存储ckpt；若开启了wandb，则这里默认为实验的名称
    - WANDB_ENABLE：是否开启wandb。如开启，需要额外填写启动命令中的wandb的配置
      - WANDB_API_KEY：必填，Wandb 账户的认证密钥，用于身份验证和访问权限。必须设置才能与 Wandb 服务端通信
      - WANDB_MODE：必填，设置为online
      - export http_proxy：设置代理，可以连接wandb服务器
      - export https_proxy：设置代理，可以连接wandb服务器`
  - 环境变量：无需更改
- 资源配置
  - 实例数：这里选择1，目前仅支持单机训练
  - 加速芯片：使用A800训练，单实例8卡
  - 共享内存：默认10Gi
  - RDMA：默认开启，无需更改
- 设置数据源
  - 存储类型：这里选择我们提前准备的PFS
  - PFS源路径：PFS的挂载路径，默认根目录，按实际情况填写
  - 挂载路径：容器内的挂载路径
点击完成，提交训练任务。

观察训练迭代

任务提交后，您可以通过任务日志观察训练的迭代情况 p0.5log.png

评价此篇文章

有帮助没帮助

使用自定义任务处理数据

基于百舸平台通过P800进行Qwen-2.5模型训练

百度智能云

百度百舸 · AI计算平台

百度百舸 · AI计算平台

基于模板微调openpi-pi0.5模型

前置条件

算力和存储资源准备

算力资源

存储资源

数据准备

数据集准备

数据转换为LeRobot dataset

准备数据映射文件和训练配置文件（可选）

模型权重& tokenizer准备

进行训练

观察训练迭代