登录
下载
Skill UI
浏览并发现
9117+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
推理
,共找到
69
条记录
默认排序
最新上传
最多下载
模型量化部署助手
model-quantization-tool
jeremylongshore/claude-code-plugins-plus-skills
222
自动化提供模型量化部署的指导,涵盖工具使用、最佳实践以及面向推理、MLops 与监控的生产准备流程。
查看详情
Onnx转换部署指南
onnx-converter
jeremylongshore/claude-code-plugins-plus-skills
113
在 ML 部署场景下自动提供 onnx 转换器的服务指导,涵盖推理、管道、监控与优化,并产出可投入生产的代码与配置。
查看详情
结构化文本生成器
outlines
Orchestra-Research/AI-Research-SKILLs
157
Outlines 通过 Pydantic 模型与语法驱动的有限状态机在生成时约束 token,使 JSON/XML/代码结构必然有效,并支持 Transformers、llama.cpp 与 vLLM 等本地模型,实现高速推理与抽样控制。
查看详情
预测监控助手
prediction-monitor
jeremylongshore/claude-code-plugins-plus-skills
240
预测监控助手自动处理机器学习部署中的监控任务,提供逐步指南、最佳实践、生产级代码配置和验证,确保服务与推理流程稳定可靠。
查看详情
提示词工程模式
prompt-engineering-patterns
sickn33/antigravity-awesome-skills
336
为提示词工程师提供从少样本、推理链到模板与系统提示等高级技巧,以提升大模型的性能、稳定性与可控性,并包含用例、验证与调优建议。
查看详情
RWKV 混合架构
rwkv-architecture
Orchestra-Research/AI-Research-SKILLs
353
RWKV 是结合 Transformer 训练与 RNN 推理的混合架构,提供线性时间推理、无限上下文与零 KV 缓存,可在流式或超长上下文场景中用 CUDA/CPU 低内存部署。
查看详情
SGLang 结构化推理服务
sglang
Orchestra-Research/AI-Research-SKILLs
475
SGLang 是面向 LLM/VLM 的高性能服务框架,采用 RadixAttention 前缀缓存实现 JSON/正则/语法结构化输出、函数调用型代理流程,并在多 GPU 生产环境中比 vLLM 快 5 倍。
查看详情
流式推理部署
streaming-inference-setup
jeremylongshore/claude-code-plugins-plus-skills
462
在询问流式推理架构或实施方案时,自动提供模型服务、MLOps、监控与生产就绪配置的部署流程指导。
查看详情
TensorRT LLM 推理优化
tensorrt-llm
Orchestra-Research/AI-Research-SKILLs
368
在 NVIDIA GPU 上使用 TensorRT 优化大模型推理,支持 FP8/INT4 量化、多 GPU 扩展及高吞吐量部署,适合实时与生产环境。
查看详情
智能体工具设计与优化
tool-design
sickn33/antigravity-awesome-skills
434
本技能提供为AI智能体设计专业级工具的指南。核心理念是将工具API视为与大型语言模型的“契约”,而非传统代码。内容涵盖工具描述优化、命名空间组织、整合原则和架构简化等高级设计模式,旨在帮助用户构建能让智能体准确推理和执行复杂工作流的工具集。
查看详情
Torchserve 配置生成器
torchserve-config-generator
jeremylongshore/claude-code-plugins-plus-skills
258
自动生成 TorchServe 部署配置,提供模型服务、MLOps 流水线、推理与生产监控的实践指导,帮助保障机器学习部署的规范性与可靠性。
查看详情
Triton 推理配置
triton-inference-config
jeremylongshore/claude-code-plugins-plus-skills
181
自动提供 Triton 推理配置指导,针对模型服务、MLOps 管道、监控与生产环境优化,生成符合业界最佳实践的配置与代码。
查看详情
上一页
1
2
3
4
5
6
下一页
语言
简体中文
English