sergiopaniego
/

smolvlm-instruct-trl-dpo-rlaif-v

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

smolvlm-instruct-trl-dpo-rlaif-v / added_tokens.json

Commit History

Training in progress, step 12

51dde93
verified

sergiopaniego commited on 30 days ago