Minesh Jethva's picture

11 65

Minesh Jethva

mineshj1291

·

minesh1291

AI & ML interests

Computer Vision & Time Series Segmentation, Detection, Seq2seq

Recent Activity

upvoted a paper 13 days ago

ReMoE: Fully Differentiable Mixture-of-Experts with ReLU Routing

liked a model 25 days ago

microsoft/resnet-50

liked a model 30 days ago

microsoft/git-base-vqav2

View all activity

Organizations

None yet

mineshj1291's activity

upvoted a paper 13 days ago

ReMoE: Fully Differentiable Mixture-of-Experts with ReLU Routing

Paper • 2412.14711 • Published 20 days ago • 15

upvoted 3 papers 3 months ago

Differential Transformer

Paper • 2410.05258 • Published Oct 7, 2024 • 169

Aria: An Open Multimodal Native Mixture-of-Experts Model

Paper • 2410.05993 • Published Oct 8, 2024 • 108

Were RNNs All We Needed?

Paper • 2410.01201 • Published Oct 2, 2024 • 51

upvoted an article 4 months ago

Article

Introducing RWKV — An RNN with the advantages of a transformer

May 15, 2023

• 14

upvoted a paper 8 months ago

TransformerFAM: Feedback attention is working memory

Paper • 2404.09173 • Published Apr 14, 2024 • 43

upvoted a collection 8 months ago

Forecast

3 items • Updated Apr 29, 2024 • 1

upvoted a paper 8 months ago

A Time Series is Worth 64 Words: Long-term Forecasting with Transformers

Paper • 2211.14730 • Published Nov 27, 2022 • 2

upvoted an article 8 months ago

Article

Patch Time Series Transformer in Hugging Face

Feb 1, 2024

• 8

upvoted 2 papers 10 months ago

Chronos: Learning the Language of Time Series

Paper • 2403.07815 • Published Mar 12, 2024 • 46

Priority Sampling of Large Language Models for Compilers

Paper • 2402.18734 • Published Feb 28, 2024 • 16