登录
下载
Skill UI
浏览并发现
9185+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
模型路由
,共找到
10
条记录
默认排序
最新上传
最多下载
自主多模型AI代理
blockrun
sickn33/antigravity-awesome-skills
360
BlockRun是一个智能代理网关,通过钱包系统连接多种外部AI服务。它可以根据用户需求,自动路由请求至最合适的模型(如DALL-E生成图像、Grok进行实时X数据搜索、GPT-5.2进行复杂推理)。用户只需支付相应的微额费用,即可无缝使用所有AI的能力,实现了能力的扩展和成本控制。
查看详情
大型语言模型上下文管理
context-window-management
sickn33/antigravity-awesome-skills
86
本技能集提供了一套高级的、结构化的LLM上下文管理策略。内容涵盖了智能总结、动态修剪、上下文路由和Token预算分配,旨在有效防止“上下文衰退”。它是构建复杂、长流程、多轮对话式AI系统的关键技术。
查看详情
Groq应用参考架构设计
groq-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
278
本指南提供了一套基于Groq LPU推理API的生产级参考架构蓝图。它系统地展示了如何根据延迟、质量或成本需求实现模型路由、流式数据管道,并构建了多提供商故障转移机制(如Groq到OpenAI备份)。适用于设计和优化复杂的、高弹性的AI应用系统。
查看详情
Langfuse LLM成本监控与优化
langfuse-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
281
本指南展示如何利用Langfuse强大的分析功能,实现大型语言模型(LLM)的成本监控、分析与优化。内容涵盖自动令牌使用量跟踪、通过Metrics API获取成本报告,以及实现智能模型路由,根据任务复杂度和输入长度自动选择最具成本效益的模型。适用于需要管理AI预算、控制LLM支出和提升系统效率的开发团队。
查看详情
MoE模型训练与优化
moe-training
Orchestra-Research/AI-Research-SKILLs
497
本技能详细介绍了专家混合模型(MoE)的训练方法,涵盖Mixtral、DeepSeek-V3等前沿模型架构。它指导用户如何在计算资源有限的情况下,实现大规模模型能力的扩展和高效训练。核心内容包括Top-k路由机制、负载均衡、专家并行以及使用DeepSpeed和HuggingFace等框架进行优化,显著降低训练成本。
查看详情
AI驱动的研究架构设计
perplexity-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
278
本技能提供了一套完整的、模仿Perplexity的AI搜索和研究系统参考架构。它涵盖了搜索服务(模型路由、缓存)、引用文献处理(提取、验证)和研究编排器(多查询合成)三个核心模块,适用于构建复杂的、增强搜索能力的AI应用和系统设计。
查看详情
智能体工程流程
agentic-engineering
affaan-m/everything-claude-code
86
指导在 AI 智能体完成实施、人类负责风险与质量把控的工程流程,强调评估优先、任务分解、模型路由及成本与回归监控。
查看详情
LLM成本优化与架构设计
llm-cost-optimizer
alirezarezvani/claude-skills
446
提供专业的LLM成本优化框架,帮助开发者通过模型路由、提示词缓存、输出长度控制和压缩等技术,系统性地降低AI API支出(可达40-80%)。旨在确保在成本受到严格控制的前提下,维持高质量、可扩展的AI功能。
查看详情
Anthropic Claude成本优化指南
anth-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
393
本指南提供了优化Anthropic Claude API使用成本的全面策略。涵盖了模型路由(根据任务选择最经济的模型)、提示词缓存(减少重复输入成本)、批量处理(处理异步任务)以及实时支出跟踪与预算预警。适用于需要管理大规模、高成本AI应用部署和精确预算控制的场景。
查看详情
生产级AI模型部署架构
together-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
333
这是一套用于构建可扩展、高可用、成本高效的AI服务层的参考架构。它涵盖了完整的AI生命周期管理,包括智能模型路由(实现成本与性能的权衡)、响应缓存、异步批量处理和模型微调管线管理。适用于需要跨多个开源模型提供高可用性的企业级应用。
查看详情
1
语言
简体中文
English