Edit Models filters

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

2,622

Full-text search

Active filters: ppo

ajagota71/pythia-410m-fb-detox

Reinforcement Learning • 0.4B • Updated May 16 • 3

jonv1/lunar-lander-v1

Reinforcement Learning • Updated May 17

jtan4albany/ppo-lunarlander

Reinforcement Learning • Updated May 19

jtan4albany/lunarlander-unit8

Reinforcement Learning • Updated May 19

GinesMeca/ppo-LunarLander-v2.1

Reinforcement Learning • Updated May 21

ajmalmahmood/ppo-CartPole-v1

Reinforcement Learning • Updated May 22

ajmalmahmood/LunarLander-v2

Reinforcement Learning • Updated May 22

winssu/LunarLander-v2-ppo

Reinforcement Learning • Updated May 22

refikcam/ppo-LunarLander-fromScratch

Reinforcement Learning • Updated May 22

vinoth16/LunarLander-v2

Reinforcement Learning • Updated May 24

gabrielbo/spark-model-QLoRA

Text Generation • Updated May 24 • 1

aarifahullah/LunarLander-v2_CleanRL

Reinforcement Learning • Updated May 24

kjamesh/ppo-CartPole-v1

Reinforcement Learning • Updated May 24

kjamesh/ppo-custom-LunarLander-v2

Reinforcement Learning • Updated May 24

wowthecoder/customPPO-LunarLander-v2

Reinforcement Learning • Updated May 25

cheetahbooked/lunar-lander-custom-ppo

Reinforcement Learning • Updated May 25

jegeblad/ppo-Lunar

Reinforcement Learning • Updated May 26

lmcastanedame/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 4 • 3

samcomber/lunar-lander-torch-ppo

Reinforcement Learning • Updated May 28

samcomber/ppo-cartpole

Reinforcement Learning • Updated May 28

nbzy1995/LunarLander-v2-scratch

Reinforcement Learning • Updated May 31

Akchunks/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 1

Saskaruza/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 11 • 4

mvyboh/HF-RL-Course-ppo-LunarLander-v2-Clean-RL

Reinforcement Learning • Updated Jun 3

ashani/ppo-CartPole-v1

Reinforcement Learning • Updated Jun 5

ashani/LunarLander-v2

Reinforcement Learning • Updated Jun 5

Adriano26/ppo.py

Reinforcement Learning • Updated Jun 7

GiovannaMariotto/PPO-CartPole-v1

Reinforcement Learning • Updated Jun 7 • 2

George067/ppo-lunarlander-2

Reinforcement Learning • Updated Jun 8

mandell/LunarLander-v2

Reinforcement Learning • Updated Jun 9