Multimodal - a Testerpce Collection

Testerpce 's Collections

Theory and Representation learning

Graph

Search

Self correction

Information_retrieval

Speech

Agent

MoE

RAG

State space LLM

Partial layer training LLMs

Math

Dataset and Data processing

Video understanding

Reinforcement learning

Multimodal

updated 2 days ago

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published Mar 26 • 156
Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO

Paper • 2505.22453 • Published 9 days ago • 45
UniRL: Self-Improving Unified Multimodal Models via Supervised and Reinforcement Learning

Paper • 2505.23380 • Published 8 days ago • 23
More Thinking, Less Seeing? Assessing Amplified Hallucination in Multimodal Reasoning Models

Paper • 2505.21523 • Published 15 days ago • 14
Visual Embodied Brain: Let Multimodal Large Language Models See, Think, and Control in Spaces

Paper • 2506.00123 • Published 7 days ago • 31