TGSO-TG资源网,专业的telegram搜索引擎

黑洞资源笔记 06-23 13:14:11

slime：一个专注于大规模强化学习扩展的LLM后训练框架，助力高效训练和灵活数据生成。高性能训练，通过连接Megatron与SGLang实现高效多模式训练；灵活的数据生成工作流，支持自定义数据生成接口和服务器引擎；提供GLM4-9B和Qwen3-4B模型示例，方便快速上手。

附件：[图片]