登录
下载
Skill UI
浏览并发现
5987+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
FP8
,共找到
3
条记录
默认排序
最新上传
最多下载
企业级 Miles 强化学习
miles-rl-training
Orchestra-Research/AI-Research-SKILLs
258
提供 miles 框架下大规模 MoE 模型的强化学习训练指导,涵盖 FP8/INT4 低精度训练、训练推理对齐、推测式 RL 提速策略以及面向企业级部署的稳定性实践。
查看详情
Flash Attention优化
optimizing-attention-flash
Orchestra-Research/AI-Research-SKILLs
169
通过 Flash Attention 加速 Transformer 关注机制,可提供 2-4 倍速度提升和 10-20 倍内存节省,适用于 PyTorch 原生、flash-attn 库、H100 FP8 和滑动窗口等长上下文模型,解决显存瓶颈并提速推理。
查看详情
TensorRT LLM 加速平台
tensorrt-llm
Orchestra-Research/AI-Research-SKILLs
376
在 NVIDIA GPU 上加速大语言模型推理,结合量化(FP8/INT4)、自动批处理和多卡扩展,实现高吞吐、低延迟的生产级服务,适合实时部署与 GPU 密集型场景。
查看详情
1
语言
简体中文
English