Representation Learning & Generation - a ZedongWangAI Collection

ZedongWangAI 's Collections

Efficient Neural Networks

Representation Learning & Generation

Representation Learning & Generation

updated Apr 3

Unveiling the Backbone-Optimizer Coupling Bias in Visual Representation Learning

Paper • 2410.06373 • Published Oct 8, 2024 • 34
MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization

Paper • 2504.00999 • Published Apr 1 • 92
What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models

Paper • 2503.24235 • Published Mar 31 • 54
MoCha: Towards Movie-Grade Talking Character Synthesis

Paper • 2503.23307 • Published Mar 30 • 134
Z1: Efficient Test-time Scaling with Code

Paper • 2504.00810 • Published Apr 1 • 26
Scaling Language-Free Visual Representation Learning

Paper • 2504.01017 • Published Apr 1 • 30
Multi-Token Attention

Paper • 2504.00927 • Published Apr 1 • 51
Efficient LLaMA-3.2-Vision by Trimming Cross-attended Visual Features

Paper • 2504.00557 • Published Apr 1 • 15