4 13 8

ZiYi Yang

AALF

https://github.com/yangzy39

yangzy39

AI & ML interests

None yet

Recent Activity

upvoted a paper 26 days ago

Group Sequence Policy Optimization

upvoted a paper about 1 month ago

Perception-Aware Policy Optimization for Multimodal Reasoning

upvoted a paper about 2 months ago

Mind2Web 2: Evaluating Agentic Search with Agent-as-a-Judge

View all activity

Organizations

Articles 2

Article

FuseO1-Preview: System-II Reasoning Fusion of LLMs

Article

FuseChat-3.0: Preference Optimization for Implicit Model Fusion

View all Articles

Papers 4

models 7

ZiYi Yang

AI & ML interests

Recent Activity

Organizations

Articles 2

FuseO1-Preview: System-II Reasoning Fusion of LLMs

FuseChat-3.0: Preference Optimization for Implicit Model Fusion

Papers 4

models 7

AALF/FuseR1-QwQ-R1-TinyR1-32B

AALF/FuseR1-QwQ-R1-LightR1-32B

AALF/FuseR1-QwQ-R1-32B

AALF/FuseR1-QwQ-R1-LightR1-TinyR1-32B

AALF/gemma-2-27b-it-SimPO-37K

AALF/gemma-2-27b-it-SimPO-37K-100steps

AALF/llama-3-8b-Instruct-simpo-beta10-gamma3-lr1e-6

datasets 1

AALF/ultrafeedback_wrpo

ZiYi Yang

AI & ML interests

Recent Activity

Organizations

Articles 2

FuseO1-Preview: System-II Reasoning Fusion of LLMs

FuseChat-3.0: Preference Optimization for Implicit Model Fusion

Papers 4

models 7 Sort: Recently updated

datasets 1

models 7