yyqoni
/

rlhflow-llama-3-sft-8b-v2-bandit-ppo-60k

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

rlhflow-llama-3-sft-8b-v2-bandit-ppo-60k

Commit History

Update README.md

4724aa2
verified

yyqoni commited on 11 days ago

Update README.md

88f0fdb
verified

yyqoni commited on 11 days ago

Upload tokenizer

9efb7aa
verified

yyqoni commited on 11 days ago

Upload LlamaForCausalLM

2ac29ce
verified

yyqoni commited on 11 days ago

initial commit

34771e4
verified

yyqoni commited on 11 days ago