Zou Lexiao's picture

5 2

Zou Lexiao

Lokshaw

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification

upvoted a paper 3 days ago

Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens

upvoted a paper 4 days ago

InfiGUI-G1: Advancing GUI Grounding with Adaptive Exploration Policy Optimization

View all activity

Organizations

upvoted 2 papers 3 days ago

On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification

Paper • 2508.05629 • Published 13 days ago • 151

Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens

Paper • 2508.01191 • Published 18 days ago • 215

upvoted a paper 4 days ago

InfiGUI-G1: Advancing GUI Grounding with Adaptive Exploration Policy Optimization

Paper • 2508.05731 • Published 13 days ago • 25

upvoted a paper 3 months ago

AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning

Paper • 2505.11896 • Published May 17 • 58

upvoted a paper over 1 year ago

Amphion: An Open-Source Audio, Music and Speech Generation Toolkit

Paper • 2312.09911 • Published Dec 15, 2023 • 55