登录
下载
Skill UI
浏览并发现
5146+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
对齐
,共找到
4
条记录
默认排序
最新上传
最多下载
宪法式人工智能安全
constitutional-ai
Orchestra-Research/AI-Research-SKILLs
358
介绍如何通过自我批判的监督训练和 RLAIF 强化训练,构建无需人工标签也能减轻有害输出的宪法式 AI 安全体系,适用于 Claude 等助手的安全对齐。
查看详情
快速NLP分词器
huggingface-tokenizers
Orchestra-Research/AI-Research-SKILLs
486
HuggingFace Tokenizers 以 Rust 性能提供高速分词,可训练多种算法,支持对齐、填充及与 transformers 的无缝集成,适配大规模生产环境。
查看详情
企业级 Miles 强化学习
miles-rl-training
Orchestra-Research/AI-Research-SKILLs
258
提供 miles 框架下大规模 MoE 模型的强化学习训练指导,涵盖 FP8/INT4 低精度训练、训练推理对齐、推测式 RL 提速策略以及面向企业级部署的稳定性实践。
查看详情
简易偏好优化训练
simpo-training
Orchestra-Research/AI-Research-SKILLs
477
SimPO 提供一种无需参考模型的偏好优化方案,能够在单节点、有限算力下更快、更简单地对齐大模型,相比 DPO/PPO 性能更好,适合希望快速训练的偏好对齐场景。
查看详情
1
语言
简体中文
English