登录
下载
Skill UI
浏览并发现
9765+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
化学
,共找到
13
条记录
默认排序
最新上传
最多下载
GRPO强化学习微调
grpo-rl-training
Orchestra-Research/AI-Research-SKILLs
416
提供基于TRL的GRPO/RLHF训练实战经验,包含数据集预处理、奖励函数设计与结构化输出指导,适合需多目标对齐且缺乏偏好对的数据场景。
查看详情
SLIME 强化训练框架
slime-rl-training
Orchestra-Research/AI-Research-SKILLs
225
为 GLM 系列大模型提供基于 Megatron-LM 与 SGLang 的后训练强化学习指导,包含 GRPO rollout、灵活数据缓冲与异步/多轮训练流程,适用于研究及产研部署。
查看详情
PyTorch原生智能体RL训练框架
torchforge-rl-training
Orchestra-Research/AI-Research-SKILLs
135
torchforge是Meta推出的用于智能体强化学习(RL)的PyTorch原生框架。它将核心的RL算法与复杂的分布式基础设施进行了彻底分离。用户可以专注于算法的快速实验和开发,无需担心底层分布式训练、权重同步等复杂问题,支持从单卡到大规模集群的扩展训练。
查看详情
火山引擎LLM强化训练
verl-rl-training
Orchestra-Research/AI-Research-SKILLs
398
使用火山引擎 verl 训练 LLM 的强化学习指南,涵盖 GRPO、PPO、价值网络、分布式 rollout、数据配置与生产部署等流程。
查看详情
分子机器学习工具集
deepchem
K-Dense-AI/claude-scientific-skills
229
DeepChem 是面向化学与生物的 Python 机器学习库,提供分子特征化、数据加载、拆分和模型训练能力,可快速用于属性、毒性、蛋白质或材料性质预测。
查看详情
高性能强化学习框架
pufferlib
K-Dense-AI/claude-scientific-skills
205
PufferLib是一个高性能的强化学习框架,专为大规模、高速的RL训练和仿真而设计。它通过优化的向量化和原生多智能体支持,实现了每秒数百万步的训练速度,极大地提升了RL研究和应用效率,适用于单智能体和多智能体环境的构建与训练。
查看详情
稳定基线3:强化学习算法工具包
stable-baselines3
K-Dense-AI/claude-scientific-skills
383
稳定基线3是一个基于PyTorch的专业库,用于提供生产级的强化学习算法实现(如PPO、SAC、DQN等)。它支持单智能体RL模型训练,提供创建自定义环境的能力,并支持通过向量化环境进行高效的并行训练。适用于快速原型开发和严谨的强化学习实验。
查看详情
论文自动优化循环
auto-paper-improvement-loop
wanshuiyin/Auto-claude-code-research-in-sleep
428
该技能用于自动化优化学术论文的写作质量。它通过循环机制(审阅→修改→重编译),利用先进的语言模型对已生成的论文进行多轮次的深度润色和优化。主要目的是提升文章的逻辑结构、修正理论不一致性,并增强整体的表达和呈现质量,帮助用户将初稿提升至可提交的优秀状态。
查看详情
量子机器学习与电路训练
pennylane
K-Dense-AI/scientific-agent-skills
89
PennyLane是一个硬件无关的量子计算库,专用于训练量子电路。它提供了自动微分功能,支持构建混合量子-经典模型,并能无缝集成PyTorch、TensorFlow等主流机器学习框架。适用于量子神经网络、变分量子本征求解器(VQE)和量子化学模拟等高级应用场景。
查看详情
高性能强化学习框架
pufferlib
K-Dense-AI/scientific-agent-skills
452
PufferLib是一个高性能的强化学习框架,专为高速并行环境模拟和训练设计。它通过优化向量化和原生多智能体支持,实现每秒数百万步的训练速度。适用于PPO算法的复杂智能体训练、自定义环境开发和大规模RL实验。
查看详情
强化学习算法训练与实现
stable-baselines3
K-Dense-AI/scientific-agent-skills
109
稳定强化学习库提供了一套基于PyTorch的生产级RL算法实现,包括PPO、SAC、DQN等主流算法。它采用类似scikit-learn的统一API,使开发者能够轻松训练RL智能体,创建自定义环境,并进行高效的向量化并行训练,适用于标准的RL研究和原型开发。
查看详情
药物发现与分子科学工具箱
torchdrug
K-Dense-AI/scientific-agent-skills
457
TorchDrug是一个专业的PyTorch工具箱,专注于药物发现和分子科学的AI计算。它利用图神经网络(GNNs)处理分子、蛋白质和生物知识图谱,支持分子性质预测、蛋白质结构建模、新分子生成以及化学合成路线规划等复杂任务,是生物医学AI研究的核心库。
查看详情
1
2
下一页
语言
简体中文
English