yyqoni
/

rlhflow-llama-3-sft-8b-v2-segment-ppo-60k

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

rlhflow-llama-3-sft-8b-v2-segment-ppo-60k

Commit History

Update README.md

942eb2f
verified

yyqoni commited on 11 days ago

Upload tokenizer

b51858c
verified

yyqoni commited on 11 days ago

Upload LlamaForCausalLM

748c1e8
verified

yyqoni commited on 11 days ago

initial commit

2a66c9e
verified

yyqoni commited on 11 days ago