sergiopaniego
/

smolvlm-instruct-trl-dpo-rlaif-v

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

smolvlm-instruct-trl-dpo-rlaif-v / runs

1 contributor

History: 40 commits

sergiopaniego's picture

Training in progress, step 210

3ad67d2 verified 26 days ago