登录
下载
Skill UI
浏览并发现
5145+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
训练
,共找到
63
条记录
默认排序
最新上传
最多下载
Torchforge 强化学习训练指南
torchforge-rl-training
Orchestra-Research/AI-Research-SKILLs
260
Torchforge RL Training 介绍了 Meta 的 PyTorch 原生强化学习框架 torchforge,强调算法与基础设施的隔离,便于用 GRPO/SFT 等损失做实验,并借助 Monarch、TorchTitan 和 vLLM 进行多卡大规模训练,同时提供配置与监控要点。
查看详情
训练测试集切分器
train-test-splitter
jeremylongshore/claude-code-plugins-plus-skills
383
该技能自动响应涉及训练/测试集划分的请求,提供行业级指导、实用代码与配置建议,并帮助验证 PyTorch、TensorFlow 或 sklearn 流程中的数据准备与模型训练环节。
查看详情
Megatron 大型模型训练
training-llms-megatron
Orchestra-Research/AI-Research-SKILLs
199
Megatron-Core 通过张量、流水线、上下文和专家并行策略,在 H100 集群上高效训练 2B~462B 参数的 LLM,是 Nemotron、LLaMA、DeepSeek 等项目的生产就绪框架。
查看详情
verl 强化学习训练指南
verl-rl-training
Orchestra-Research/AI-Research-SKILLs
486
使用 verl 的 HybridFlow 框架,在数百亿参数模型上以 PPO、GRPO、DAPO 等算法进行 RLHF 后训练,支持多种训练后端、带工具的多轮 rollout 及评估。
查看详情
wandb实验日志记录
wandb-experiment-logger
jeremylongshore/claude-code-plugins-plus-skills
201
在机器学习训练中自动处理 wandb 实验日志任务,提供流程指导、最佳实践、代码配置示例及校验,确保数据准备、模型训练、超参调优与实验追踪一致。
查看详情
Weights And Biases 试验管理平台
weights-and-biases
Orchestra-Research/AI-Research-SKILLs
148
Weights & Biases 提供自动记录指标、配置和制品的 MLOps 平台,通过实时仪表盘监控训练、对比实验、自动调参并共享模型,适用于团队协作和模型管理场景。
查看详情
IDC癌症影像数据访问
imaging-data-commons
K-Dense-AI/claude-scientific-skills
352
通过 idc-index SDK 无需认证即可查询、下载并在浏览器中预览美国国家癌症研究所 IDC 中的公开癌症放射与病理影像数据,方便构建 AI 训练与研究流程。
查看详情
PufferLib 高性能强化学习
pufferlib
K-Dense-AI/claude-scientific-skills
172
PufferLib 是一个高性能强化学习框架,适合需要并行模拟、向量化环境和多智能体训练的场景,可实现百万步/秒级 PPO 训练,并与 Gymnasium、Atari、Procgen 等环境无缝集成。
查看详情
PyHealth 医疗 AI 工具包
pyhealth
K-Dense-AI/claude-scientific-skills
202
PyHealth 提供面向电子病历、信号、影像与编码数据的临床预测模型开发、训练、评估与部署能力,包含标准化数据集、任务、模型与解释、校准等模块,适合医疗 AI 场景。
查看详情
PyTorch Lightning训练流程
pytorch-lightning
K-Dense-AI/claude-scientific-skills
278
PyTorch Lightning 规范模块、数据、回调与 Trainer 设置,支持多 GPU/TPU 和分布式策略,方便追踪与调度训练流程。
查看详情
稳健基线3强化学习指南
stable-baselines3
K-Dense-AI/claude-scientific-skills
500
Stable Baselines3 提供基于 PyTorch 的强化学习算法、统一 API、训练流程、环境模板、向量化执行与回调机制,适合 Gymnasium 单智能体实验与快速原型开发。
查看详情
TimesFM 零样本预测工具
timesfm-forecasting
K-Dense-AI/claude-scientific-skills
63
借助 Google TimesFM 预训练基础模型,快速零样本生成一元时间序列点预测与校准区间,并在加载权重前强制校验 RAM/GPU/磁盘等资源,适用于销售、传感器、能源等场景。
查看详情
上一页
1
2
3
4
5
6
下一页
语言
简体中文
English