17 34 167

Yongliang Shen

tricktreat

tricktreat

AI & ML interests

None yet

Recent Activity

liked a model 4 days ago

Qwen/Qwen3-30B-A3B

liked a model 4 days ago

Qwen/Qwen3-32B

authored a paper 8 days ago

Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models

View all activity

Organizations

liked 2 models 4 days ago

Qwen/Qwen3-30B-A3B

Text Generation • 31B • Updated 26 days ago • 1M • • 766

Qwen/Qwen3-32B

Text Generation • 33B • Updated 26 days ago • 927k • • 499

authored a paper 8 days ago

Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models

Paper • 2508.09138 • Published 8 days ago • 34

upvoted a paper 8 days ago

Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models

Paper • 2508.09138 • Published 8 days ago • 34

commented a paper 9 days ago

OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks

Paper • 2508.05614 • Published 13 days ago • 18 •

authored 3 papers 10 days ago

Cooper: Co-Optimizing Policy and Reward Models in Reinforcement Learning for Large Language Models

Paper • 2508.05613 • Published 13 days ago • 16

OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks

Paper • 2508.05614 • Published 13 days ago • 18

Test-Time Reinforcement Learning for GUI Grounding via Region Consistency

Paper • 2508.05615 • Published 13 days ago • 20

upvoted 2 papers 10 days ago

Cooper: Co-Optimizing Policy and Reward Models in Reinforcement Learning for Large Language Models

Paper • 2508.05613 • Published 13 days ago • 16

Test-Time Reinforcement Learning for GUI Grounding via Region Consistency

Paper • 2508.05615 • Published 13 days ago • 20

liked a dataset 10 days ago

wangzx1210/OmniEAR

Viewer • Updated 12 days ago • 30.2k • 343 • 10

upvoted a paper 12 days ago

OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks

Paper • 2508.05614 • Published 13 days ago • 18

upvoted an article 20 days ago

Article

Introducing Trackio: A Lightweight Experiment Tracking Library from Hugging Face

and 4 others •

23 days ago

• 156

commented 2 papers 27 days ago

Hierarchical Budget Policy Optimization for Adaptive Reasoning

Paper • 2507.15844 • Published about 1 month ago • 16 •

LAPO: Internalizing Reasoning Efficiency via Length-Adaptive Policy Optimization

Paper • 2507.15758 • Published about 1 month ago • 34 •

upvoted a paper 28 days ago

MathFimer: Enhancing Mathematical Reasoning by Expanding Reasoning Steps through Fill-in-the-Middle Task

Paper • 2502.11684 • Published Feb 17 • 2

authored 4 papers 30 days ago

MathFimer: Enhancing Mathematical Reasoning by Expanding Reasoning Steps through Fill-in-the-Middle Task

Paper • 2502.11684 • Published Feb 17 • 2

Yongliang Shen

AI & ML interests

Recent Activity

Organizations

tricktreat's activity

Introducing Trackio: A Lightweight Experiment Tracking Library from Hugging Face