15 590 248

Taufiq Dwi Purnomo

taufiqdp

https://taufiqdp.com

AI & ML interests

SLM, VLM

Recent Activity

upvoted a paper 1 day ago

Transformers without Normalization

liked a model 1 day ago

sesame/csm-1b

liked a Space 1 day ago

sesame/csm-1b

View all activity

Organizations

taufiqdp's activity

upvoted 2 papers 1 day ago

Transformers without Normalization

Paper • 2503.10622 • Published 1 day ago • 56

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published 3 days ago • 46

upvoted an article 2 days ago

Article

LeRobot goes to driving school: World’s largest open-source self-driving dataset

4 days ago

• 47

upvoted a collection 3 days ago

Gemma 3 Release

Collection

9 items • Updated 1 day ago • 238

upvoted 2 papers 3 days ago

Gemini Embedding: Generalizable Embeddings from Gemini

Paper • 2503.07891 • Published 5 days ago • 25

Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast Asia

Paper • 2503.07920 • Published 4 days ago • 89

upvoted a paper 4 days ago

Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders

Paper • 2503.03601 • Published 10 days ago • 208

upvoted a paper 5 days ago

EuroBERT: Scaling Multilingual Encoders for European Languages

Paper • 2503.05500 • Published 8 days ago • 72

upvoted a paper 9 days ago

Babel: Open Multilingual Large Language Models Serving Over 90% of Global Speakers

Paper • 2503.00865 • Published 13 days ago • 58

upvoted a paper 11 days ago

Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs

Paper • 2503.01743 • Published 12 days ago • 72

upvoted a paper 15 days ago

NeoBERT: A Next-Generation BERT

Paper • 2502.19587 • Published 17 days ago • 38

upvoted a paper 17 days ago

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

Paper • 2502.18137 • Published 18 days ago • 53

upvoted 2 papers 18 days ago

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 24 days ago • 66

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

Paper • 2502.15007 • Published 23 days ago • 162

upvoted a collection 22 days ago

SigLIP2

Collection

36 items • Updated 3 days ago • 62

upvoted 2 papers 22 days ago

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published 23 days ago • 97

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published 23 days ago • 129

upvoted an article 22 days ago

Article

SmolVLM2: Bringing Video Understanding to Every Device

23 days ago

• 205

upvoted an article 23 days ago

Article

PaliGemma 2 Mix - New Instruction Vision Language Models by Google

24 days ago

• 65

upvoted a collection 23 days ago

PaliGemma 2 Mix

Collection

13 items • Updated 3 days ago • 60