llm - a always-exploring-321 Collection

always-exploring-321 's Collections

llm

llm

updated Jun 5

Self-Generated In-Context Examples Improve LLM Agents for Sequential Decision-Making Tasks

Paper • 2505.00234 • Published May 1 • 26
DeepCritic: Deliberate Critique with Large Language Models

Paper • 2505.00662 • Published May 1 • 54
A Survey of Interactive Generative Video

Paper • 2504.21853 • Published Apr 30 • 47
OThink-R1: Intrinsic Fast/Slow Thinking Mode Switching for Over-Reasoning Mitigation

Paper • 2506.02397 • Published Jun 3 • 35
Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning

Paper • 2505.24726 • Published May 30 • 269