登录
下载
Skill UI
浏览并发现
9987+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
高效推理
,共找到
9
条记录
默认排序
最新上传
最多下载
大模型上下文工程基础
context-fundamentals
sickn33/antigravity-awesome-skills
223
本技能深入讲解了大型语言模型(LLMs)推理时可用的完整状态(上下文)。内容涵盖系统提示、工具定义、消息历史记录和检索文档等核心组件。掌握上下文工程是构建稳定、高效AI智能体的关键,它指导用户如何优化上下文内容,管理注意力预算,确保模型接收到最相关的“高信号”信息。
查看详情
GGUF量化:高效大模型推理
gguf-quantization
Orchestra-Research/AI-Research-SKILLs
403
本指南深入介绍GGUF格式和模型量化技术,旨在实现大语言模型(LLM)在消费级硬件上的高效推理。通过采用GGUF标准格式和K-quant方法进行模型压缩,可以显著降低内存和硬件要求,使开发者能够在Apple Silicon、CPU或边缘设备上部署高性能AI应用。
查看详情
知识蒸馏:大模型压缩
knowledge-distillation
Orchestra-Research/AI-Research-SKILLs
417
知识蒸馏(KD)是一种核心的AI模型压缩技术。它旨在将性能强大的大型语言模型(Teacher)的知识,高效地转移给更小、更易于部署的学生模型(Student)。这使得开发者能够在不损失关键性能的前提下,大幅降低推理成本,实现将前沿大模型能力落地到实际应用场景。
查看详情
Vast.ai GPU成本优化指南
vastai-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
191
本工具包旨在帮助用户优化Vast.ai上的GPU云资源使用成本。它提供了选择成本效益最高GPU型号、利用抢占式(Spot)实例以及设置自动销毁机制的完整指南。通过检测闲置计算资源和监控运行费用,确保AI模型训练和推理作业能够高效、经济地完成。
查看详情
本地大模型推理与部署专家
local-llm-expert
sickn33/antigravity-awesome-skills
484
该技能专精于本地大语言模型(LLM)的部署、推理和性能优化。涵盖Ollama、vLLM、llama.cpp等主流推理引擎,以及GGUF、EXL2等主流量化格式。帮助用户在本地硬件上安全、高效地运行先进模型,尤其侧重于隐私保护和离线应用部署。
查看详情
无服务器GPU云平台:AI训练与推理
serverless-modal
wanshuiyin/Auto-claude-code-research-in-sleep
281
这是一个零配置的无服务器GPU云平台,专为运行复杂的机器学习工作负载而设计,包括模型训练、微调和实时推理。它无需复杂的环境设置(无需SSH或Docker),支持本地优先和自动弹性伸缩,适用于所有高性能GPU。非常适合需要可扩展、高效率远程计算资源的AI工程师和数据科学家。
查看详情
云端机器学习工作负载迁移指南
coreweave-migration-deep-dive
jeremylongshore/claude-code-plugins-plus-skills
205
本技能包详细指导用户如何将机器学习工作负载(包括推理服务和训练管道)从AWS/GCP/Azure等大型云平台迁移到CoreWeave GPU云。内容涵盖成本对比、容器化步骤、Kubernetes配置适配和分阶段部署,帮助用户确保迁移过程平稳、高效且具成本效益。
查看详情
Together AI大模型开发调试包
together-debug-bundle
jeremylongshore/claude-code-plugins-plus-skills
207
本调试包为使用Together AI的OpenAI兼容API提供了全面的开发指南。它涵盖了LLM生命周期的关键环节,包括模型推理、精调和部署,支持主流开源模型。同时,它详细列出了常见的API错误代码及解决方案,帮助开发者高效解决问题,顺利完成AI项目开发。
查看详情
Together AI性能调优指南
together-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
299
本技能提供关于使用Together AI平台进行性能调优、推理和模型微调的综合指南。它支持与Together AI的OpenAI兼容API工作,涵盖模型部署、使用多种开源模型(如Llama, Mixtral)以及实现高效、低成本的批量推理最佳实践。
查看详情
1
语言
简体中文
English