yakazimir
/

llama3instruct_-orpo-10-0_5-1e-6-1_best

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama3instruct_-orpo-10-0_5-1e-6-1_best

Commit History

End of training

aeebb44
verified

yakazimir commited on Nov 19, 2024

Model save

a33c5e7
verified

yakazimir commited on Nov 19, 2024

Training in progress, step 457

a7b0678
verified

yakazimir commited on Nov 19, 2024

initial commit

2da972c
verified

yakazimir commited on Nov 19, 2024