스킬 파일

Finetune

Name: Finetune
Author: dengyufuqin

Finetune a policy model on a benchmark dataset. Supports LeRobot models (pi0, pi0.5, smolvla) and OpenVLA. Submits as SLURM job for multi-GPU training.

dengyufuqin0 스타2026. 4. 15.

직업
카테고리: 머신러닝

스킬 내용

Finetune Policy Model

Finetune a VLA model on a benchmark's training data. Supports two backends:

Supported Models

Model	Backend	Base Checkpoint
pi0	LeRobot	`lerobot/pi0_base`
pi0.5	LeRobot	`lerobot/pi05_base`
smolvla	LeRobot	`lerobot/smolvla_base`
openvla	OpenVLA	`openvla/openvla-7b`

Supported Datasets

Benchmark	LeRobot Dataset	OpenVLA (RLDS) Dataset
libero_spatial	`lerobot/libero_spatial_image`

관련 스킬

Finetune | Skills Pool

libero_spatial_no_noops

# Finetune pi0 on LIBERO spatial (LeRobot backend)
finetune(policy="pi0", benchmark="libero_spatial", steps=50000)

# Finetune OpenVLA on LIBERO goal (OpenVLA backend, 4 GPUs)
finetune(policy="openvla", benchmark="libero_goal", num_gpus=4, steps=150000)

# Finetune pi0.5 on RoboCasa
finetune(policy="pi0.5", benchmark="robocasa", steps=100000)

run_benchmark(policy="pi0", benchmark="libero_spatial", checkpoint="checkpoints/pi0-libero_spatial/checkpoint_50000")

Finetune

Finetune Policy Model

Supported Models

Supported Datasets

Finetune

Finetune Policy Model

Supported Models

Supported Datasets

Examples

Output

Continuous Learning V2

Continuous Learning V2

Continuous Learning V2

Continuous Learning

Continuous Learning

Pytorch Patterns