下载

Skill UI

浏览并发现 7271+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索模型路由，共找到 15 条记录

默认排序最新上传最多下载

大型语言模型上下文管理

context-window-management

sickn33/antigravity-awesome-skills

本技能集提供了一套高级的、结构化的LLM上下文管理策略。内容涵盖了智能总结、动态修剪、上下文路由和Token预算分配，旨在有效防止“上下文衰退”。它是构建复杂、长流程、多轮对话式AI系统的关键技术。

成本感知型 LLM 流水线

cost-aware-llm-pipeline

affaan-m/everything-claude-code

将模型路由、预算追踪、重试策略与提示缓存组合成可复用流水线，帮助多模型批处理在保障质量的同时控制 Claude/GPT 等 LLM API 的支出。

FastAPI 路由构建与最佳实践

fastapi-router-py

sickn33/antigravity-awesome-skills

本指南提供了一套创建健壮、可扩展的 FastAPI 路由的完整模式。它涵盖了最佳实践，包括实现认证逻辑（必需/可选依赖），使用 Pydantic 定义结构化响应模型，以及正确设置 HTTP 状态码。适用于需要构建结构化、安全且符合规范的 Python 后端 API 的场景。

Groq参考架构指南

groq-reference-architecture

jeremylongshore/claude-code-plugins-plus-skills

提供 Groq LPU 生产级架构指南，讲解模型分层路由、流式流水线、降级策略与监控，便于设计低延迟实时 AI 应用。

Langfuse 成本优化指南

langfuse-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

利用 Langfuse 观测数据跟踪每次生成的令牌消耗，汇总模型与时间维度的成本，设置预算告警，并通过模型路由、缓存与提示优化降低整体 AI 开支。

Mistral 速率控制策略

mistral-rate-limits

jeremylongshore/claude-code-plugins-plus-skills

提供 Mistral AI 的请求/令牌限流器、重试退避、模型路由和批量嵌入模板，确保各模型档位的吞吐控制、自动降级与 429 错误处理。

MoE模型训练与优化

Orchestra-Research/AI-Research-SKILLs

本技能详细介绍了专家混合模型（MoE）的训练方法，涵盖Mixtral、DeepSeek-V3等前沿模型架构。它指导用户如何在计算资源有限的情况下，实现大规模模型能力的扩展和高效训练。核心内容包括Top-k路由机制、负载均衡、专家并行以及使用DeepSpeed和HuggingFace等框架进行优化，显著降低训练成本。

OpenRouter 模型路由

openrouter-model-routing

jeremylongshore/claude-code-plugins-plus-skills

实现 OpenRouter 模型路由，支持 A/B 测试、渐进发布与性能驱动的模型选择，便于在多个环境中优化多模型部署与实验。

OpenRouter路由规则

openrouter-routing-rules

jeremylongshore/claude-code-plugins-plus-skills

实现基于请求内容、成本和延迟的 OpenRouter 模型路由，适配项目配置、测试验证并监控上线状态，帮助团队在多约束场景下选择最优模型。

Perplexity 企业级 RBAC 管理

perplexity-enterprise-rbac

jeremylongshore/claude-code-plugins-plus-skills

设置 Perplexity 企业 RBAC，涵盖 SSO、组织管理、模型限制 API 密钥、查询路由、域过滤、使用监控与密钥轮换，确保团队访问安全合规。

Perplexity架构指南

perplexity-reference-architecture

jeremylongshore/claude-code-plugins-plus-skills

提供 Perplexity 研究与搜索项目的参考架构，涵盖模型路由、引用提取、对话式检索与多轮查询流水线，确保集成与结构审核遵循最佳实践。

智能体工程流程

agentic-engineering

affaan-m/everything-claude-code

指导在 AI 智能体完成实施、人类负责风险与质量把控的工程流程，强调评估优先、任务分解、模型路由及成本与回归监控。

语言