登录
下载
Skill UI
浏览并发现
5145+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
后训练
,共找到
4
条记录
默认排序
最新上传
最多下载
深度学习模型优化
optimizing-deep-learning-models
jeremylongshore/claude-code-plugins-plus-skills
370
通过分析模型结构、数据与指标,自动选择优化器、调度学习率和正则化方法,生成优化后的代码并评估准确率、训练时间与资源消耗,适合需要提升性能与效率的深度学习模型。
查看详情
Optuna 训练试验助手
optuna-study-creator
jeremylongshore/claude-code-plugins-plus-skills
56
自动触发的 ML 训练技能,识别“optuna study creator”相关请求后,即提供数据准备、模型训练、超参数调优与实验追踪等全流程指导,并给出生产级代码与校验。
查看详情
Slime 强化学习训练框架
slime-rl-training
Orchestra-Research/AI-Research-SKILLs
214
使用 Slime(Megatron+SGLang)框架提供 LLM 强化学习后训练指引,涵盖 GLM、Qwen、Llama 等模型的数据缓冲、Rollout 管理与 Megatron-LM 集成,便于扩展式策略优化。
查看详情
verl 强化学习训练指南
verl-rl-training
Orchestra-Research/AI-Research-SKILLs
486
使用 verl 的 HybridFlow 框架,在数百亿参数模型上以 PPO、GRPO、DAPO 等算法进行 RLHF 后训练,支持多种训练后端、带工具的多轮 rollout 及评估。
查看详情
1
语言
简体中文
English