CodCodingCode
/

llama-3.1-8b-grpo-v1.4

Model card Files Files and versions

llama-3.1-8b-grpo-v1.4 / tokenizer.json

Commit History

GRPO-trained model from checkpoint-550

90a88a2
verified

CodCodingCode commited on Jun 24