Jiaheng Liu's picture

Jiaheng Liu

CheeryLJH

·

AI & ML interests

None yet

Recent Activity

authored a paper 2 days ago

xCoT: Cross-lingual Instruction Tuning for Cross-lingual Chain-of-Thought Reasoning

authored a paper 2 days ago

Emulated Disalignment: Safety Alignment for Large Language Models May Backfire!

authored a paper 2 days ago

m3P: Towards Multimodal Multilingual Translation with Multimodal Prompt

View all activity

Organizations

CheeryLJH's activity

upvoted 2 papers 5 days ago

CodeElo: Benchmarking Competition-level Code Generation of LLMs with Human-comparable Elo Ratings

Paper • 2501.01257 • Published 6 days ago • 42

ProgCo: Program Helps Self-Correction of Large Language Models

Paper • 2501.01264 • Published 6 days ago • 23

upvoted a paper 19 days ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published 19 days ago • 338

upvoted a paper 28 days ago

Evaluating and Aligning CodeLLMs on Human Preference

Paper • 2412.05210 • Published Dec 6, 2024 • 47

upvoted a paper 30 days ago

MAmmoTH-VL: Eliciting Multimodal Reasoning with Instruction Tuning at Scale

Paper • 2412.05237 • Published Dec 6, 2024 • 47

upvoted 2 papers about 2 months ago

OmniEdit: Building Image Editing Generalist Models Through Specialist Supervision

Paper • 2411.07199 • Published Nov 11, 2024 • 46

Chinese SimpleQA: A Chinese Factuality Evaluation for Large Language Models

Paper • 2411.07140 • Published Nov 11, 2024 • 33

upvoted 3 papers 2 months ago

OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models

Paper • 2411.04905 • Published Nov 7, 2024 • 113

M2rc-Eval: Massively Multilingual Repository-level Code Completion Evaluation

Paper • 2410.21157 • Published Oct 28, 2024 • 6

AutoKaggle: A Multi-Agent Framework for Autonomous Data Science Competitions

Paper • 2410.20424 • Published Oct 27, 2024 • 40

upvoted 9 papers 3 months ago

A Comparative Study on Reasoning Patterns of OpenAI's o1 Model

Paper • 2410.13639 • Published Oct 17, 2024 • 17

Can MLLMs Understand the Deep Implication Behind Chinese Images?

Paper • 2410.13854 • Published Oct 17, 2024 • 10

PopAlign: Diversifying Contrasting Patterns for a More Comprehensive Alignment

Paper • 2410.13785 • Published Oct 17, 2024 • 19

MTU-Bench: A Multi-granularity Tool-Use Benchmark for Large Language Models

Paper • 2410.11710 • Published Oct 15, 2024 • 19

MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering

Paper • 2410.07095 • Published Oct 9, 2024 • 6

ING-VP: MLLMs cannot Play Easy Vision-based Games Yet

Paper • 2410.06555 • Published Oct 9, 2024 • 8

MIO: A Foundation Model on Multimodal Tokens

Paper • 2409.17692 • Published Sep 26, 2024 • 53

Pixel-Space Post-Training of Latent Diffusion Models

Paper • 2409.17565 • Published Sep 26, 2024 • 20

OmniBench: Towards The Future of Universal Omni-Language Models

Paper • 2409.15272 • Published Sep 23, 2024 • 27

upvoted a paper 4 months ago

HelloBench: Evaluating Long Text Generation Capabilities of Large Language Models

Paper • 2409.16191 • Published Sep 24, 2024 • 42