plaguss
/

Qwen2.5-0.5B-Math-Shepherd-PRM-0.2

Token Classification

Generated from Trainer

stepwise-reward-trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-0.5B-Math-Shepherd-PRM-0.2 / README.md

Commit History

Update README.md

4f4cbe1
verified

plaguss HF staff commited on 29 days ago

Update README.md

447453b
verified

plaguss HF staff commited on 29 days ago

End of training

32dbfed
verified

plaguss HF staff commited on about 1 month ago

Model save

ad6ce55
verified

plaguss HF staff commited on about 1 month ago