Unchun Yang's picture

Unchun Yang

ucyang

·

https://ucyang.com/

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

Training Large Language Models to Reason in a Continuous Latent Space

upvoted a paper 4 days ago

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

liked a dataset 5 days ago

cognitivecomputations/WizardLM_alpaca_evol_instruct_70k_unfiltered

View all activity

Organizations

ucyang's activity

upvoted a paper 3 days ago

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published 28 days ago • 68

upvoted a paper 4 days ago

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

Paper • 2402.03300 • Published Feb 5, 2024 • 76

liked a dataset 5 days ago

cognitivecomputations/WizardLM_alpaca_evol_instruct_70k_unfiltered

Viewer • Updated Apr 28, 2023 • 55k • 95 • 125

upvoted 2 papers 6 days ago

MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models

Paper • 2309.12284 • Published Sep 21, 2023 • 19

Hermes 3 Technical Report

Paper • 2408.11857 • Published Aug 15, 2024 • 43

liked a model 9 days ago

Skywork/Skywork-o1-Open-PRM-Qwen-2.5-1.5B

Text Classification • Updated Nov 27, 2024 • 797 • 22

liked 2 models 10 days ago

Skywork/Skywork-o1-Open-PRM-Qwen-2.5-7B

Text Classification • Updated Nov 27, 2024 • 1.89k • 41

Skywork/Skywork-o1-Open-Llama-3.1-8B

Text Generation • Updated Nov 27, 2024 • 1.56k • 96

upvoted a collection 10 days ago

Skywork-o1-Open

Skywork o1 open model collections • 3 items • Updated Nov 27, 2024 • 20

liked a Space 11 days ago

Running on CPU Upgrade

Anychat

liked a model 11 days ago

deepseek-ai/DeepSeek-Prover-V1.5-RL

Updated Aug 29, 2024 • 7.82k • 40

upvoted a paper 11 days ago

DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data

Paper • 2405.14333 • Published May 23, 2024 • 37

upvoted a collection 11 days ago

DeepSeek-Prover

DeepSeek-V1-and-V1.5-Series • 7 items • Updated Aug 16, 2024 • 20

liked 2 models 11 days ago

deepseek-ai/DeepSeek-V2.5-1210

Text Generation • Updated 26 days ago • 344k • 235

deepseek-ai/deepseek-vl2

Image-Text-to-Text • Updated 20 days ago • 2.04k • 125

upvoted a paper 11 days ago

DeepSeek-VL2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding

Paper • 2412.10302 • Published 24 days ago • 11

upvoted a collection 11 days ago

DeepSeek-VL2

4 items • Updated 20 days ago • 34

liked 2 models 11 days ago

deepseek-ai/DeepSeek-V3

Updated 8 days ago • 71.7k • 1.32k

deepseek-ai/DeepSeek-V3-Base

Updated 8 days ago • 8.36k • 1.16k

upvoted a collection 11 days ago

DeepSeek-V3

3 items • Updated about 20 hours ago • 98