1 19 10

long

kevinlong

AI & ML interests

None yet

Recent Activity

liked a Space 6 days ago

akhaliq/anychat

upvoted a paper about 1 month ago

PaliGemma 2: A Family of Versatile VLMs for Transfer

View all activity

Organizations

None yet

kevinlong's activity

upvoted a paper about 1 month ago

PaliGemma 2: A Family of Versatile VLMs for Transfer

Paper • 2412.03555 • Published Dec 4, 2024 • 121

upvoted a paper 3 months ago

MIMO: Controllable Character Video Synthesis with Spatial Decomposed Modeling

Paper • 2409.16160 • Published Sep 24, 2024 • 33

upvoted 2 papers 4 months ago

Portrait Video Editing Empowered by Multimodal Generative Priors

Paper • 2409.13591 • Published Sep 20, 2024 • 16

OmniGen: Unified Image Generation

Paper • 2409.11340 • Published Sep 17, 2024 • 109

upvoted an article 4 months ago

Article

Design choices for Vision Language Models in 2024

•

Apr 16, 2024

• 25

upvoted a paper 4 months ago

IFAdapter: Instance Feature Control for Grounded Text-to-Image Generation

Paper • 2409.08240 • Published Sep 12, 2024 • 19

upvoted a paper 6 months ago

AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks

Paper • 2403.14468 • Published Mar 21, 2024 • 23

upvoted a collection 6 months ago

H2O Danube3

Collection

7 items • Updated Nov 30, 2024 • 56

upvoted a paper 6 months ago

SpreadsheetLLM: Encoding Spreadsheets for Large Language Models

Paper • 2407.09025 • Published Jul 12, 2024 • 131

upvoted 2 papers 8 months ago

Hunyuan-DiT: A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding

Paper • 2405.08748 • Published May 14, 2024 • 19

DreamTuner: Single Image is Enough for Subject-Driven Generation

Paper • 2312.13691 • Published Dec 21, 2023 • 26

upvoted a paper 9 months ago

Long-form music generation with latent diffusion

Paper • 2404.10301 • Published Apr 16, 2024 • 24

upvoted 4 papers 10 months ago

OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on

Paper • 2403.01779 • Published Mar 4, 2024 • 28

upvoted a paper 11 months ago

Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models

Paper • 2402.17177 • Published Feb 27, 2024 • 88

upvoted 2 papers about 1 year ago

ImageDream: Image-Prompt Multi-view Diffusion for 3D Generation

Paper • 2312.02201 • Published Dec 2, 2023 • 31

MVDream: Multi-view Diffusion for 3D Generation

Paper • 2308.16512 • Published Aug 31, 2023 • 102