HF中国镜像站

rasdani
/

Qwen2.5-0.5B-Open-R1-Code-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-0.5B-Open-R1-Code-GRPO / merges.txt

Commit History

Training in progress, step 50

aca93e1
verified

rasdani commited on 6 days ago