登录
下载
Skill UI
浏览并发现
7271+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
模型路由
,共找到
15
条记录
默认排序
最新上传
最多下载
大型语言模型上下文管理
context-window-management
sickn33/antigravity-awesome-skills
86
本技能集提供了一套高级的、结构化的LLM上下文管理策略。内容涵盖了智能总结、动态修剪、上下文路由和Token预算分配,旨在有效防止“上下文衰退”。它是构建复杂、长流程、多轮对话式AI系统的关键技术。
查看详情
成本感知型 LLM 流水线
cost-aware-llm-pipeline
affaan-m/everything-claude-code
260
将模型路由、预算追踪、重试策略与提示缓存组合成可复用流水线,帮助多模型批处理在保障质量的同时控制 Claude/GPT 等 LLM API 的支出。
查看详情
FastAPI 路由构建与最佳实践
fastapi-router-py
sickn33/antigravity-awesome-skills
206
本指南提供了一套创建健壮、可扩展的 FastAPI 路由的完整模式。它涵盖了最佳实践,包括实现认证逻辑(必需/可选依赖),使用 Pydantic 定义结构化响应模型,以及正确设置 HTTP 状态码。适用于需要构建结构化、安全且符合规范的 Python 后端 API 的场景。
查看详情
Groq参考架构指南
groq-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
54
提供 Groq LPU 生产级架构指南,讲解模型分层路由、流式流水线、降级策略与监控,便于设计低延迟实时 AI 应用。
查看详情
Langfuse 成本优化指南
langfuse-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
357
利用 Langfuse 观测数据跟踪每次生成的令牌消耗,汇总模型与时间维度的成本,设置预算告警,并通过模型路由、缓存与提示优化降低整体 AI 开支。
查看详情
Mistral 速率控制策略
mistral-rate-limits
jeremylongshore/claude-code-plugins-plus-skills
455
提供 Mistral AI 的请求/令牌限流器、重试退避、模型路由和批量嵌入模板,确保各模型档位的吞吐控制、自动降级与 429 错误处理。
查看详情
MoE模型训练与优化
moe-training
Orchestra-Research/AI-Research-SKILLs
497
本技能详细介绍了专家混合模型(MoE)的训练方法,涵盖Mixtral、DeepSeek-V3等前沿模型架构。它指导用户如何在计算资源有限的情况下,实现大规模模型能力的扩展和高效训练。核心内容包括Top-k路由机制、负载均衡、专家并行以及使用DeepSpeed和HuggingFace等框架进行优化,显著降低训练成本。
查看详情
OpenRouter 模型路由
openrouter-model-routing
jeremylongshore/claude-code-plugins-plus-skills
355
实现 OpenRouter 模型路由,支持 A/B 测试、渐进发布与性能驱动的模型选择,便于在多个环境中优化多模型部署与实验。
查看详情
OpenRouter路由规则
openrouter-routing-rules
jeremylongshore/claude-code-plugins-plus-skills
60
实现基于请求内容、成本和延迟的 OpenRouter 模型路由,适配项目配置、测试验证并监控上线状态,帮助团队在多约束场景下选择最优模型。
查看详情
Perplexity 企业级 RBAC 管理
perplexity-enterprise-rbac
jeremylongshore/claude-code-plugins-plus-skills
410
设置 Perplexity 企业 RBAC,涵盖 SSO、组织管理、模型限制 API 密钥、查询路由、域过滤、使用监控与密钥轮换,确保团队访问安全合规。
查看详情
Perplexity架构指南
perplexity-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
76
提供 Perplexity 研究与搜索项目的参考架构,涵盖模型路由、引用提取、对话式检索与多轮查询流水线,确保集成与结构审核遵循最佳实践。
查看详情
智能体工程流程
agentic-engineering
affaan-m/everything-claude-code
86
指导在 AI 智能体完成实施、人类负责风险与质量把控的工程流程,强调评估优先、任务分解、模型路由及成本与回归监控。
查看详情
1
2
下一页
语言
简体中文
English