下载

Skill UI

浏览并发现 9765+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索化学，共找到 13 条记录

默认排序最新上传最多下载

GRPO强化学习微调

grpo-rl-training

Orchestra-Research/AI-Research-SKILLs

提供基于TRL的GRPO/RLHF训练实战经验，包含数据集预处理、奖励函数设计与结构化输出指导，适合需多目标对齐且缺乏偏好对的数据场景。

SLIME 强化训练框架

slime-rl-training

Orchestra-Research/AI-Research-SKILLs

为 GLM 系列大模型提供基于 Megatron-LM 与 SGLang 的后训练强化学习指导，包含 GRPO rollout、灵活数据缓冲与异步/多轮训练流程，适用于研究及产研部署。

PyTorch原生智能体RL训练框架

torchforge-rl-training

Orchestra-Research/AI-Research-SKILLs

torchforge是Meta推出的用于智能体强化学习（RL）的PyTorch原生框架。它将核心的RL算法与复杂的分布式基础设施进行了彻底分离。用户可以专注于算法的快速实验和开发，无需担心底层分布式训练、权重同步等复杂问题，支持从单卡到大规模集群的扩展训练。

火山引擎LLM强化训练

verl-rl-training

Orchestra-Research/AI-Research-SKILLs

使用火山引擎 verl 训练 LLM 的强化学习指南，涵盖 GRPO、PPO、价值网络、分布式 rollout、数据配置与生产部署等流程。

分子机器学习工具集

K-Dense-AI/claude-scientific-skills

DeepChem 是面向化学与生物的 Python 机器学习库，提供分子特征化、数据加载、拆分和模型训练能力，可快速用于属性、毒性、蛋白质或材料性质预测。

高性能强化学习框架

K-Dense-AI/claude-scientific-skills

PufferLib是一个高性能的强化学习框架，专为大规模、高速的RL训练和仿真而设计。它通过优化的向量化和原生多智能体支持，实现了每秒数百万步的训练速度，极大地提升了RL研究和应用效率，适用于单智能体和多智能体环境的构建与训练。

稳定基线3：强化学习算法工具包

stable-baselines3

K-Dense-AI/claude-scientific-skills

稳定基线3是一个基于PyTorch的专业库，用于提供生产级的强化学习算法实现（如PPO、SAC、DQN等）。它支持单智能体RL模型训练，提供创建自定义环境的能力，并支持通过向量化环境进行高效的并行训练。适用于快速原型开发和严谨的强化学习实验。

论文自动优化循环

auto-paper-improvement-loop

wanshuiyin/Auto-claude-code-research-in-sleep

该技能用于自动化优化学术论文的写作质量。它通过循环机制（审阅→修改→重编译），利用先进的语言模型对已生成的论文进行多轮次的深度润色和优化。主要目的是提升文章的逻辑结构、修正理论不一致性，并增强整体的表达和呈现质量，帮助用户将初稿提升至可提交的优秀状态。

量子机器学习与电路训练

K-Dense-AI/scientific-agent-skills

PennyLane是一个硬件无关的量子计算库，专用于训练量子电路。它提供了自动微分功能，支持构建混合量子-经典模型，并能无缝集成PyTorch、TensorFlow等主流机器学习框架。适用于量子神经网络、变分量子本征求解器（VQE）和量子化学模拟等高级应用场景。

高性能强化学习框架

K-Dense-AI/scientific-agent-skills

PufferLib是一个高性能的强化学习框架，专为高速并行环境模拟和训练设计。它通过优化向量化和原生多智能体支持，实现每秒数百万步的训练速度。适用于PPO算法的复杂智能体训练、自定义环境开发和大规模RL实验。

强化学习算法训练与实现

stable-baselines3

K-Dense-AI/scientific-agent-skills

稳定强化学习库提供了一套基于PyTorch的生产级RL算法实现，包括PPO、SAC、DQN等主流算法。它采用类似scikit-learn的统一API，使开发者能够轻松训练RL智能体，创建自定义环境，并进行高效的向量化并行训练，适用于标准的RL研究和原型开发。

药物发现与分子科学工具箱

K-Dense-AI/scientific-agent-skills

TorchDrug是一个专业的PyTorch工具箱，专注于药物发现和分子科学的AI计算。它利用图神经网络（GNNs）处理分子、蛋白质和生物知识图谱，支持分子性质预测、蛋白质结构建模、新分子生成以及化学合成路线规划等复杂任务，是生物医学AI研究的核心库。

语言