Oussama Gabouj's picture

Oussama Gabouj

Ousso1117

Ousso11

AI & ML interests

None yet

Recent Activity

updated a model 3 minutes ago

Ousso1117/SFT-meta-Llama-3.1-8B-mrd3

updated a model about 6 hours ago

Ousso1117/PPO-meta-Llama-3.2-1B-meta-Llama-3.2-1B-mrd3

updated a model 3 days ago

Ousso1117/PPO-meta-Llama-3.2-3B-meta-Llama-3.2-3B-mrd3

View all activity

Organizations

None yet

Ousso1117's activity

updated a model 3 minutes ago

Ousso1117/SFT-meta-Llama-3.1-8B-mrd3

Updated 3 minutes ago

updated a model about 6 hours ago

Ousso1117/PPO-meta-Llama-3.2-1B-meta-Llama-3.2-1B-mrd3

Text Generation • Updated about 6 hours ago • 51

updated a model 3 days ago

Ousso1117/PPO-meta-Llama-3.2-3B-meta-Llama-3.2-3B-mrd3

Text Generation • Updated 3 days ago • 20

updated a model 5 days ago

Ousso1117/PPO-SFT-meta-Llama-3.2-1B-meta-Llama-3.2-1B-mrd3

Reinforcement Learning • Updated 5 days ago • 41

updated 14 models 6 days ago

Ousso1117/SFT-meta-Llama-3.2-1B-mrd3

Updated 6 days ago

Ousso1117/PPO-SFT-meta-Llama-2-7B-meta-Llama-2-7B-mrd3

Reinforcement Learning • Updated 6 days ago • 16

Ousso1117/PPO-SFT-meta-Llama-3.1-8B-meta-Llama-2-7B-mrd3

Reinforcement Learning • Updated 6 days ago • 4

Ousso1117/PPO-SFT-meta-Llama-2-7B-meta-Llama-3.2-3B-mrd3

Reinforcement Learning • Updated 6 days ago • 4

Ousso1117/PPO-SFT-meta-Llama-3.1-8B-meta-Llama-3.1-8B-mrd3

Reinforcement Learning • Updated 6 days ago • 16

Ousso1117/PPO-meta-Llama-3.1-8B-meta-Llama-2-7B-mrd3

Reinforcement Learning • Updated 6 days ago • 4

Ousso1117/PPO-meta-Llama-2-7B-meta-Llama-2-7B-mrd3

Reinforcement Learning • Updated 6 days ago • 16

Ousso1117/PPO-meta-Llama-3.1-8B-meta-Llama-3.1-8B-mrd3

Reinforcement Learning • Updated 6 days ago • 16

Ousso1117/PPO-SFT-meta-Llama-3.2-3B-meta-Llama-2-7B-mrd3

Reinforcement Learning • Updated 6 days ago • 6

Ousso1117/PPO-meta-Llama-2-7B-meta-Llama-3.2-3B-mrd3

Reinforcement Learning • Updated 6 days ago • 4

Ousso1117/PPO-SFT-meta-Llama-3.2-3B-meta-Llama-3.2-3B-mrd3

Reinforcement Learning • Updated 6 days ago • 21

Ousso1117/PPO-meta-Llama-3.2-3B-meta-Llama-2-7B-mrd3

Reinforcement Learning • Updated 6 days ago • 4

Ousso1117/SFT-meta-Llama-2-7B-mrd3

Updated 6 days ago

Ousso1117/SFT-meta-Llama-3.2-3B-mrd3

Updated 6 days ago