Edit Models filters

Inference Providers

Nebius AI Studio

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

Carbon Emissions

Mixture of Experts

text-embeddings-inference

Misc with no match

Models

6,870

Full-text search

Active filters: grpo

howardzhou/Qwen2.5-3B-Open-R1-GRPO

Text Generation • Updated Feb 5 • 15

justinj92/Qwen2.5-1.5B-Thinking-v1.1

Text Generation • Updated Feb 4 • 27 • 2

jainamit/qwen-2.5-3b-r1-countdown

Text Generation • Updated Feb 6 • 10

GitBag/Qwen2.5-1.5B-Open-R1-GRPO

Text Generation • Updated Feb 4 • 19

justinj92/Qwen2.5-1.5B-Thinking-v1.1-Q8_0-GGUF

Updated Feb 4 • 10

justinj92/Qwen2.5-1.5B-Thinking-v1.1-Q5_K_M-GGUF

Updated Feb 4 • 1

Dongwei/Qwen-2.5-7B

Text Generation • Updated Feb 3 • 7

mradermacher/Qwen2.5-1.5B-Thinking-GGUF

Updated Apr 30 • 69 • 1

mradermacher/DeepSeek-R1-Qwen-2.5-1.5b-GGUF

Updated Feb 4 • 129 • 1

emre/Qwen-0.5B-GRPO

Text Generation • Updated Feb 3 • 8

peulsilva/reasoning-qwen-epoch0

Text Generation • Updated Feb 3 • 8

peulsilva/reasoning-qwen-epoch1

Text Generation • Updated Feb 3 • 7

spinech/qwen2.5-3b-r1-arc-train-synthetic

Text Generation • Updated Feb 4 • 8

peulsilva/reasoning-qwen-epoch2

Text Generation • Updated Feb 3 • 7

laolaorkk/Qwen2.5-1.5B-R1-GRPO-debug

Text Generation • Updated Feb 6 • 10

Dongwei/DeepSeek-R1-Distill-Qwen-7B-GRPO_Math

Text Generation • Updated Feb 4 • 16

Dongwei/Qwen-2.5-7B_Math

Text Generation • Updated Feb 4 • 15

Dongwei/Qwen2.5-1.5B-Open-R1-GRPO_Math

Text Generation • Updated Feb 3 • 26

Dongwei/DeepSeek-R1-Distill-Qwen-1.5B-GRPO_Math

Text Generation • Updated Feb 3 • 16

peulsilva/reasoning-qwen-epoch3

Text Generation • Updated Feb 3 • 7

mradermacher/DeepSeek-R1-Distill-Qwen-7B-GRPO-GGUF

Updated Feb 4 • 34

skzxjus/Qwen2.5-7B-Open-R1-GRPO

Text Generation • Updated Feb 8 • 10

AndreasX1206/Qwen2-0.5B-countdown

Text Generation • Updated Feb 4 • 7

mradermacher/Qwen-0.5B-GRPO-GGUF

Updated Feb 3 • 31

alicogniai/Qwen2.5-1.5B-Open-R1-GRPO

Text Generation • Updated Feb 16 • 9

ununtrium/Qwen2.5-1.5B-Open-R1-GRPO

Text Generation • Updated Feb 11 • 5

mradermacher/DeepSeek-R1-Distill-Qwen-7B-GRPO-i1-GGUF

Updated Feb 4 • 139

yuta0x89/llmjp13b-numinacot-epoch2-GRPO

Text Generation • Updated Feb 11 • 6

yeshsurya/Qwen2.5-7B-Math-with_50stepGRPO

Text Generation • Updated Feb 12 • 15

mradermacher/DeepSeek-R1-Distill-Qwen-1.5B-GRPO_Math-GGUF

Updated Feb 4 • 86