登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
研究优化
,共找到
3
条记录
默认排序
最新上传
最多下载
高性能强化学习框架
pufferlib
K-Dense-AI/claude-scientific-skills
205
PufferLib是一个高性能的强化学习框架,专为大规模、高速的RL训练和仿真而设计。它通过优化的向量化和原生多智能体支持,实现了每秒数百万步的训练速度,极大地提升了RL研究和应用效率,适用于单智能体和多智能体环境的构建与训练。
查看详情
自主研究论文迭代评审
auto-review-loop-minimax
wanshuiyin/Auto-claude-code-research-in-sleep
215
该技能模拟了顶级学术会议(如NeurIPS, ICML)的同行评审流程。它通过与外部大模型(MiniMax)进行多轮深度交互,自动对研究论文进行评估、识别关键弱点,并跟踪修改状态,指导用户进行迭代优化,直到研究成果达到可接受的提交标准。
查看详情
高性能强化学习框架
pufferlib
K-Dense-AI/scientific-agent-skills
179
PufferLib是一个高性能的强化学习框架,专为大规模、高速的RL训练和仿真而设计。它通过优化的向量化和原生多智能体支持,实现了每秒数百万步的训练速度,极大地提升了RL研究和应用效率,适用于单智能体和多智能体环境的构建与训练。
查看详情
1
语言
简体中文
English