Efficient LLM - a kevin1020 Collection

kevin1020 's Collections

Data

RAG

Inference Acceleration

Code Generation

Efficient Tuning

Token Compression

Efficient VLM via Image Token Compression

VLM

PEFT

ViT

Modular

Efficient LLM

updated Feb 24

Phantom of Latent for Large Language and Vision Models

Paper • 2409.14713 • Published Sep 23, 2024 • 30
SeerAttention: Learning Intrinsic Sparse Attention in Your LLMs

Paper • 2410.13276 • Published Oct 17, 2024 • 30
LightThinker: Thinking Step-by-Step Compression

Paper • 2502.15589 • Published Feb 21 • 29