登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
特征发现
,共找到
1
条记录
默认排序
最新上传
最多下载
稀疏自编码器:模型可解释性分析
sparse-autoencoder-training
Orchestra-Research/AI-Research-SKILLs
251
本工具提供稀疏自编码器(SAE)的训练和分析框架。SAEs能够将大型语言模型内部密集的、多义的激活信号分解为稀疏、单义的特征。适用于需要发现模型学到的离散可解释概念、研究特征叠加性,或分析模型内部特定安全相关行为(如偏见或欺骗)的场景。
查看详情
1
语言
简体中文
English