登录
下载
Skill UI
浏览并发现
9200+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
推理
,共找到
119
条记录
默认排序
最新上传
最多下载
CPU/边缘本地大模型推理
llama-cpp
Orchestra-Research/AI-Research-SKILLs
249
llama.cpp是一个纯C/C++编写的轻量级推理框架,专为在资源受限的设备上运行大型语言模型(LLM)而设计。它特别适用于没有高性能NVIDIA GPU(CUDA)的场景,非常适合Apple Silicon、AMD/Intel GPU以及边缘计算设备。通过支持GGUF量化,可以实现内存占用和推理速度的显著优化,支持本地跨平台部署。
查看详情
LLM应用模式与架构
llm-app-patterns
sickn33/antigravity-awesome-skills
283
本技能集提供了一套生产级的LLM应用开发蓝图。它全面覆盖了RAG(检索增强生成)的完整流程,从文档切块到混合检索。此外,书中还详细介绍了ReAct等高级Agent架构模式,帮助开发者构建具备复杂推理和工具使用能力的企业级AI系统。
查看详情
智能体内存系统设计
memory-systems
sickn33/antigravity-awesome-skills
423
本技能专注于设计和构建复杂、分层的AI智能体内存架构。它超越了简单的上下文窗口和向量存储的局限,引入了短期、长期和基于图谱的内存系统。使用此技能可确保智能体在会话间保持记忆持久性,维护实体一致性,并在累积的知识库上进行高级、关系驱动的推理,包括时序知识追踪。
查看详情
企业级大模型强化学习训练
miles-rl-training
Orchestra-Research/AI-Research-SKILLs
145
为企业级 MoE 大模型提供 miles 强化学习训练指导,覆盖 FP8/INT4 低精度、训练推理对齐与投机式推理流程,保障稳定性与最大吞吐量。
查看详情
Mistral AI异步工作流与事件处理
mistral-webhooks-events
jeremylongshore/claude-code-plugins-plus-skills
201
本技能指南详细介绍了Mistral AI的异步处理模式。内容涵盖了使用Agents API构建状态化的多轮对话工作流、利用Batch API进行成本效益高的批量推理,以及实现事件驱动的流式架构。适用于需要处理复杂、长时间运行或高并发数据的AI系统开发。
查看详情
Modal 无服务器 GPU 平台
modal-serverless-gpu
Orchestra-Research/AI-Research-SKILLs
226
Modal 无服务器 GPU 平台提供按秒计费的按需 GPU 访问,从 T4 到 H200,可快速部署模型 API、执行批处理作业并跳过基础设施运维,适合原型验证与推理训练任务。
查看详情
模型漂移检测
model-drift-detector
jeremylongshore/claude-code-plugins-plus-skills
198
自动化提供模型漂移检测的部署建议,包含实践规范、可用的生产代码与校验措施,帮助你监控推理系统并保持稳定运行。
查看详情
LLM模型剪枝实用指南
model-pruning
Orchestra-Research/AI-Research-SKILLs
437
通过 Wanda、SparseGPT 与 N:M 结构化剪枝,快速压缩大语言模型,提升稀疏度与推理速度,无需再训练即可部署在移动或边缘硬件。
查看详情
模型量化部署助手
model-quantization-tool
jeremylongshore/claude-code-plugins-plus-skills
222
自动化提供模型量化部署的指导,涵盖工具使用、最佳实践以及面向推理、MLops 与监控的生产准备流程。
查看详情
Ollama本地LLM部署配置
ollama-setup
jeremylongshore/claude-code-plugins-plus-skills
122
本技能用于配置和部署本地的大型语言模型(LLM)环境,使用 Ollama。它会自动检测您的操作系统和硬件资源,选择合适的模型,并完成在 macOS、Linux 或 Docker 上的安装。这使得用户能够实现离线、免费的AI推理,无需依赖外部API服务,适用于构建生产环境的AI应用。
查看详情
Onnx转换部署指南
onnx-converter
jeremylongshore/claude-code-plugins-plus-skills
113
在 ML 部署场景下自动提供 onnx 转换器的服务指导,涵盖推理、管道、监控与优化,并产出可投入生产的代码与配置。
查看详情
模型智能路由与成本优化
openrouter-model-routing
jeremylongshore/claude-code-plugins-plus-skills
461
本技能提供一套完整的OpenRouter模型路由实现方案。它指导开发者如何根据任务的复杂度、所需的模型能力(如深度推理、代码生成)以及当前的成本预算,动态地选择最合适的LLM模型。通过实现成本感知、任务导向和复杂度识别的路由机制,可以确保系统在构建多模型应用时,既能达到最佳性能,又能有效控制运营成本。
查看详情
上一页
1
2
3
4
5
6
...
8
9
10
下一页
语言
简体中文
English