登录
下载
Skill UI
浏览并发现
9952+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
成本调优
,共找到
5
条记录
默认排序
最新上传
最多下载
Langfuse LLM可观测性与监控
langfuse-observability
jeremylongshore/claude-code-plugins-plus-skills
211
本文指导如何为LLM应用建立全面的可观测性监控体系。通过集成Prometheus指标,可以实时追踪LLM的调用次数、生成延迟、Token消耗量和费用成本。适用于性能调优、成本控制及系统健康状态的持续监控。
查看详情
Cohere API性能调优指南
cohere-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
466
本指南提供全面的Cohere API v2性能优化策略。旨在帮助用户优化Chat、Embed和Rerank等核心API的使用效率,显著提高API吞吐量、降低延迟和管理成本。核心技术包括根据延迟预算选择最佳模型、实现流式传输(Streaming)以提升用户体验、高效批量嵌入(Batching)处理、向量压缩以及部署缓存机制。
查看详情
Together AI成本调优指南
together-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
122
本指南提供一套全面的成本优化方案,用于在使用Together AI的OpenAI兼容API时管理和降低支出。内容涵盖推理(inference)、微调(fine-tuning)和模型部署等多个环节的最佳实践。用户可以学习如何根据需求选择合适的模型规模、利用缓存和批量推理等技术,从而在保证性能的同时,最小化AI运行成本。
查看详情
Together AI性能调优指南
together-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
299
本技能提供关于使用Together AI平台进行性能调优、推理和模型微调的综合指南。它支持与Together AI的OpenAI兼容API工作,涵盖模型部署、使用多种开源模型(如Llama, Mixtral)以及实现高效、低成本的批量推理最佳实践。
查看详情
Wispr Flow语音转文本API调优
wispr-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
331
该技能提供使用Wispr Flow进行语音转文本API集成的成本优化和技术指南。内容涵盖WebSocket流式传输、REST API使用、上下文理解(如编程代码)和错误处理的最佳实践,帮助开发者构建高级语音应用。
查看详情
1
语言
简体中文
English