登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
训练框架
,共找到
20
条记录
默认排序
最新上传
最多下载
BLIP-2 视觉语言框架
blip-2-vision-language
Orchestra-Research/AI-Research-SKILLs
239
该框架将冻结的图像编码器与大语言模型连接,适用于图像描述、视觉问答、检索与多模态对话,在无需微调的条件下实现零样本推理,并仅训练轻量 Q-Former。
查看详情
LLM 评估框架
evaluating-llms-harness
Orchestra-Research/AI-Research-SKILLs
484
提供涵盖 MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag 等 60+ 学术基准测试的标准化评估流程,可用来对 HuggingFace、vLLM 或 API 模型打分、比对性能、跟踪训练进度。
查看详情
梯度裁剪助手
gradient-clipping-helper
jeremylongshore/claude-code-plugins-plus-skills
417
梯度裁剪助手针对机器学习训练流程提供自动化支持,指导梯度裁剪模式、生成可部署代码与配置,并校验 PyTorch、TensorFlow 等框架下的结果。
查看详情
MoE模型训练与优化
moe-training
Orchestra-Research/AI-Research-SKILLs
199
本技能详细介绍了专家混合模型(MoE)的训练方法,涵盖Mixtral、DeepSeek-V3等前沿模型架构。它指导用户如何在计算资源有限的情况下,实现大规模模型能力的扩展和高效训练。核心内容包括Top-k路由机制、负载均衡、专家并行以及使用DeepSpeed和HuggingFace等框架进行优化,显著降低训练成本。
查看详情
极简GPT模型训练与学习系统
nanogpt
Orchestra-Research/AI-Research-SKILLs
467
nanoGPT是一个极简主义的GPT模型实现,专为教育和学习设计。它以简洁、可修改的代码复刻了GPT-2的核心架构,使用户能够从零开始理解整个Transformer流程。该框架支持完整的工作流,包括数据准备、模型训练和文本生成,非常适合学习NLP和深度学习原理的学生和研究人员。
查看详情
OpenRLHF训练套件
openrlhf-training
Orchestra-Research/AI-Research-SKILLs
474
一个基于Ray和vLLM的高性能RLHF训练框架,兼容PPO、GRPO、RLOO、DPO,借助ZeRO-3与分布式架构在多GPU集群上加速7B-70B+大模型的策略与奖励优化流程。
查看详情
PyTorch Lightning 训练框架
pytorch-lightning
Orchestra-Research/AI-Research-SKILLs
235
PyTorch Lightning 提供高层训练框架,内置分布式训练(DDP/FSDP/DeepSpeed)、回调、检查点、日志与设备管理,帮助你从笔记本到多节点集群轻松运行高质量模型训练。
查看详情
PyTorch模型因果干预
pyvene-interventions
Orchestra-Research/AI-Research-SKILLs
110
pyvene是一个用于在PyTorch模型上执行因果干预的声明式框架。它支持激活打补丁、因果追踪(ROME风格)和交替干预训练等高级实验。适用于需要测试模型因果假设、深入理解模型组件工作机制或确保可复现性的AI研究场景。
查看详情
句向量嵌入框架
sentence-transformers
Orchestra-Research/AI-Research-SKILLs
326
Sentence Transformers 提供 5000+ 预训练模型,可生成句、文本与图像嵌入,支持 RAG、语义搜索、聚类、多语言与多模态,适合本地生产环境使用。
查看详情
SLIME 强化训练框架
slime-rl-training
Orchestra-Research/AI-Research-SKILLs
225
为 GLM 系列大模型提供基于 Megatron-LM 与 SGLang 的后训练强化学习指导,包含 GRPO rollout、灵活数据缓冲与异步/多轮训练流程,适用于研究及产研部署。
查看详情
稀疏自编码器:模型可解释性分析
sparse-autoencoder-training
Orchestra-Research/AI-Research-SKILLs
251
本工具提供稀疏自编码器(SAE)的训练和分析框架。SAEs能够将大型语言模型内部密集的、多义的激活信号分解为稀疏、单义的特征。适用于需要发现模型学到的离散可解释概念、研究特征叠加性,或分析模型内部特定安全相关行为(如偏见或欺骗)的场景。
查看详情
PyTorch原生智能体RL训练框架
torchforge-rl-training
Orchestra-Research/AI-Research-SKILLs
135
torchforge是Meta推出的用于智能体强化学习(RL)的PyTorch原生框架。它将核心的RL算法与复杂的分布式基础设施进行了彻底分离。用户可以专注于算法的快速实验和开发,无需担心底层分布式训练、权重同步等复杂问题,支持从单卡到大规模集群的扩展训练。
查看详情
1
2
下一页
语言
简体中文
English