登录
下载
Skill UI
浏览并发现
9765+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
模型优化
,共找到
154
条记录
默认排序
最新上传
最多下载
Groq成本优化与管理
groq-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
424
本技能提供了一套全面的Groq API成本优化指南。内容涵盖了智能模型路由(为简单任务选择更小的模型)、最小化Token使用、批量处理请求以减少系统开销,以及实现缓存机制以提高效率。旨在帮助开发者在处理大流量AI工作负载时,实现显著的成本节约和系统性能提升。
查看详情
Groq API性能优化指南
groq-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
172
本技能旨在提供一套完整的Groq API性能优化方案。它指导用户如何根据应用需求选择最佳模型,实现语义缓存、流式传输、精简Prompt和并行请求,从而在需要极低延迟和高吞吐量的大规模应用场景中,充分挖掘Groq算力的潜力。
查看详情
Groq应用参考架构设计
groq-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
278
本指南提供了一套基于Groq LPU推理API的生产级参考架构蓝图。它系统地展示了如何根据延迟、质量或成本需求实现模型路由、流式数据管道,并构建了多提供商故障转移机制(如Groq到OpenAI备份)。适用于设计和优化复杂的、高弹性的AI应用系统。
查看详情
优化 Ideogram API 成本
ideogram-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
341
本技能提供了一套完整的 Ideogram API 成本优化方案。它指导用户通过模型分级选择、批量调用、缓存提示词和设置预算监控,极大地降低图像生成成本。适用于需要进行大规模、高频率 AI 图像创作的开发者。
查看详情
推理延迟分析器
inference-latency-profiler
jeremylongshore/claude-code-plugins-plus-skills
208
本技能自动处理推理延迟分析器相关任务,在 ML 部署场景中提供模型服务、MLOps 管道、监控和生产优化等按步骤指导,生成生产级代码并校验输出标准,助力快速完成推理性能调优。
查看详情
Kling AI视频性能优化指南
klingai-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
450
本指南提供了优化Kling AI视频生成流程的综合策略。它指导用户如何根据使用场景,在速度、质量和成本之间做出权衡,从而选择最佳的模型和参数。内容涵盖性能基准测试、连接池优化、缓存策略和提示词工程最佳实践,确保生成过程高效且高质量。
查看详情
LangChain API成本优化指南
langchain-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
326
本指南提供了一套完整的LangChain LLM API成本优化策略。通过实现令牌使用追踪、根据任务复杂度分级路由模型、利用缓存机制消除重复调用、进行提示词压缩,以及强制执行预算限制,帮助开发者在保证应用质量的同时,显著降低运行成本。
查看详情
LangChain性能调优与优化
langchain-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
407
本指南提供了全面的LangChain应用性能优化技巧,帮助开发者将应用提升至生产级别。内容涵盖了基准测试、流式传输(提升用户感知速度)、并发批量处理、持久化缓存(如Redis/SQLite)的实现,以及如何通过精简Prompt和选择合适的模型来降低延迟和成本。
查看详情
Langfuse LLM成本监控与优化
langfuse-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
281
本指南展示如何利用Langfuse强大的分析功能,实现大型语言模型(LLM)的成本监控、分析与优化。内容涵盖自动令牌使用量跟踪、通过Metrics API获取成本报告,以及实现智能模型路由,根据任务复杂度和输入长度自动选择最具成本效益的模型。适用于需要管理AI预算、控制LLM支出和提升系统效率的开发团队。
查看详情
Langfuse本地开发与调试工作流
langfuse-local-dev-loop
jeremylongshore/claude-code-plugins-plus-skills
390
本指南提供了一套完整的Langfuse本地开发工作流,专为LLM应用开发设计。它支持热重载、实时追踪和调试功能,使用户能够在本地环境中快速迭代、观察和优化所有的模型调用及流程,并可选地部署本地私有实例,确保开发体验流畅高效。
查看详情
Lindy AI成本优化与工作流管理
lindy-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
183
本指南提供了一套系统化的成本优化方案,旨在帮助用户管理和降低Lindy AI平台的运行成本。内容涵盖了如何审计智能体(Agent)的资源消耗、根据任务复杂度调整模型尺寸(Right-Sizing)、合并冗余的自动化流程,以及优化触发器的频率。通过这些步骤,可以确保AI工作流的高效率和成本可控性。
查看详情
AI智能体性能优化指南
lindy-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
346
本指南详细介绍了如何系统化地优化AI智能体(Agents)的运行效率、降低成本和提高稳定性。通过模型尺寸匹配、步骤合并、优化知识库查询以及精细化触发器设置,帮助用户解决智能体运行缓慢、费用过高或结果不一致的复杂问题。
查看详情
上一页
1
2
3
4
5
6
...
11
12
13
下一页
语言
简体中文
English