Kaiyan Zhang's picture

Kaiyan Zhang

iseesaw

·

iseesaw

AI & ML interests

None yet

Recent Activity

upvoted a paper 4 days ago

ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

liked a model 8 days ago

deepseek-ai/DeepSeek-R1-0528

upvoted a paper 9 days ago

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

View all activity

Organizations

Papers 21

arxiv:2504.16084

arxiv:2504.00891

arxiv:2503.18942

arxiv:2503.11224

models 0

None public yet

datasets 0

None public yet