登录
下载
Skill UI
浏览并发现
9944+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
模型路由
,共找到
27
条记录
默认排序
最新上传
最多下载
自主多模型AI代理
blockrun
sickn33/antigravity-awesome-skills
360
BlockRun是一个智能代理网关,通过钱包系统连接多种外部AI服务。它可以根据用户需求,自动路由请求至最合适的模型(如DALL-E生成图像、Grok进行实时X数据搜索、GPT-5.2进行复杂推理)。用户只需支付相应的微额费用,即可无缝使用所有AI的能力,实现了能力的扩展和成本控制。
查看详情
Clerk费用优化与成本控制
clerk-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
140
本技能提供了一套全面的系统,用于优化Clerk认证服务的成本。内容涵盖了理解MAU定价模型、通过限制认证路由来减少活跃用户数、使用缓存机制减少API调用,以及编写脚本清理不活跃用户,帮助开发者有效控制支出和优化资源使用。
查看详情
大型语言模型上下文管理
context-window-management
sickn33/antigravity-awesome-skills
86
本技能集提供了一套高级的、结构化的LLM上下文管理策略。内容涵盖了智能总结、动态修剪、上下文路由和Token预算分配,旨在有效防止“上下文衰退”。它是构建复杂、长流程、多轮对话式AI系统的关键技术。
查看详情
成本感知LLM管道优化
cost-aware-llm-pipeline
affaan-m/everything-claude-code
265
该模式提供了一套构建成本优化LLM应用管道的完整方案。它结合了基于任务复杂度的模型路由、不可变成本追踪、有限重试逻辑和提示缓存等技术,帮助开发者在保证输出质量的同时,有效地控制和管理LLM API的支出,适用于处理高并发、多变复杂度的生产级任务系统。
查看详情
FastAPI 路由构建与最佳实践
fastapi-router-py
sickn33/antigravity-awesome-skills
206
本指南提供了一套创建健壮、可扩展的 FastAPI 路由的完整模式。它涵盖了最佳实践,包括实现认证逻辑(必需/可选依赖),使用 Pydantic 定义结构化响应模型,以及正确设置 HTTP 状态码。适用于需要构建结构化、安全且符合规范的 Python 后端 API 的场景。
查看详情
Groq成本优化与管理
groq-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
424
本技能提供了一套全面的Groq API成本优化指南。内容涵盖了智能模型路由(为简单任务选择更小的模型)、最小化Token使用、批量处理请求以减少系统开销,以及实现缓存机制以提高效率。旨在帮助开发者在处理大流量AI工作负载时,实现显著的成本节约和系统性能提升。
查看详情
Groq应用参考架构设计
groq-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
278
本指南提供了一套基于Groq LPU推理API的生产级参考架构蓝图。它系统地展示了如何根据延迟、质量或成本需求实现模型路由、流式数据管道,并构建了多提供商故障转移机制(如Groq到OpenAI备份)。适用于设计和优化复杂的、高弹性的AI应用系统。
查看详情
LangChain API成本优化指南
langchain-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
326
本指南提供了一套完整的LangChain LLM API成本优化策略。通过实现令牌使用追踪、根据任务复杂度分级路由模型、利用缓存机制消除重复调用、进行提示词压缩,以及强制执行预算限制,帮助开发者在保证应用质量的同时,显著降低运行成本。
查看详情
Langfuse LLM成本监控与优化
langfuse-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
281
本指南展示如何利用Langfuse强大的分析功能,实现大型语言模型(LLM)的成本监控、分析与优化。内容涵盖自动令牌使用量跟踪、通过Metrics API获取成本报告,以及实现智能模型路由,根据任务复杂度和输入长度自动选择最具成本效益的模型。适用于需要管理AI预算、控制LLM支出和提升系统效率的开发团队。
查看详情
MoE模型训练与优化
moe-training
Orchestra-Research/AI-Research-SKILLs
199
本技能详细介绍了专家混合模型(MoE)的训练方法,涵盖Mixtral、DeepSeek-V3等前沿模型架构。它指导用户如何在计算资源有限的情况下,实现大规模模型能力的扩展和高效训练。核心内容包括Top-k路由机制、负载均衡、专家并行以及使用DeepSpeed和HuggingFace等框架进行优化,显著降低训练成本。
查看详情
大模型API合规审计与最佳实践
openrouter-compliance-review
jeremylongshore/claude-code-plugins-plus-skills
397
这是一份关于使用OpenRouter集成大模型(LLMs)进行合规审计的指南。文章详细介绍了如何满足SOC2、GDPR和HIPAA等监管要求。内容涵盖数据处理、访问控制、个人身份信息(PII)去标识化、建立审计日志以及配置提供商路由,确保数据主权和满足行业严格标准。
查看详情
构建AI模型故障转移与高可用性
openrouter-fallback-config
jeremylongshore/claude-code-plugins-plus-skills
296
本技能详细介绍了如何在OpenRouter环境下为大型语言模型(LLM)配置故障转移和回退机制。它涵盖了原生模型回退、提供商路由策略和客户端级故障链设计。当构建对可靠性要求极高、必须在主模型或提供商不可用时也能持续运作的系统时,应使用此模式,以确保API集成和系统优雅降级。
查看详情
1
2
3
下一页
语言
简体中文
English