登录
下载
Skill UI
浏览并发现
9747+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
成本型
,共找到
34
条记录
默认排序
最新上传
最多下载
Cohere成本优化与用量控制
cohere-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
104
本技能集提供了管理和优化 Cohere API 成本的综合策略。它指导用户如何通过模型分级、设置Token预算、优化Embedding存储以及建立实时用量监控系统,有效控制AI应用运行的API开销,确保成本可预测性。
查看详情
Cohere API性能调优指南
cohere-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
466
本指南提供全面的Cohere API v2性能优化策略。旨在帮助用户优化Chat、Embed和Rerank等核心API的使用效率,显著提高API吞吐量、降低延迟和管理成本。核心技术包括根据延迟预算选择最佳模型、实现流式传输(Streaming)以提升用户体验、高效批量嵌入(Batching)处理、向量压缩以及部署缓存机制。
查看详情
CoreWeave GPU成本优化指南
coreweave-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
258
本指南提供了一套全面的策略,用于优化CoreWeave上的云GPU资源支出。它涵盖了从根据模型需求进行精细化资源配置(Right-sizing),到为开发环境实施从零扩展(Scale-to-Zero),以及利用量化技术(如AWQ)等多个维度,帮助用户在确保高性能的同时,实现AI/ML工作负载的最大化成本节约。
查看详情
云端机器学习工作负载迁移指南
coreweave-migration-deep-dive
jeremylongshore/claude-code-plugins-plus-skills
205
本技能包详细指导用户如何将机器学习工作负载(包括推理服务和训练管道)从AWS/GCP/Azure等大型云平台迁移到CoreWeave GPU云。内容涵盖成本对比、容器化步骤、Kubernetes配置适配和分阶段部署,帮助用户确保迁移过程平稳、高效且具成本效益。
查看详情
ElevenLabs成本优化与配额监控
elevenlabs-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
446
本技能旨在帮助用户优化 ElevenLabs 语音合成(TTS)的运行成本。它提供了一套完整的流程,包括基于成本的模型选择、通过优化文本内容来减少计费字符数,以及实现实时的配额使用监控和预算预警。适用于构建高并发、对成本敏感的语音应用。
查看详情
Together AI成本调优指南
together-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
122
本指南提供一套全面的成本优化方案,用于在使用Together AI的OpenAI兼容API时管理和降低支出。内容涵盖推理(inference)、微调(fine-tuning)和模型部署等多个环节的最佳实践。用户可以学习如何根据需求选择合适的模型规模、利用缓存和批量推理等技术,从而在保证性能的同时,最小化AI运行成本。
查看详情
Together AI性能调优指南
together-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
299
本技能提供关于使用Together AI平台进行性能调优、推理和模型微调的综合指南。它支持与Together AI的OpenAI兼容API工作,涵盖模型部署、使用多种开源模型(如Llama, Mixtral)以及实现高效、低成本的批量推理最佳实践。
查看详情
Together AI生产部署清单
together-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
373
本清单是一份完整的M/Ops指南,用于指导使用Together AI API构建AI应用的生产环境部署。它涵盖了生产环境的关键环节,包括安全密钥管理、API限流处理、错误容错机制(如断路器和重试)、以及全面的监控和成本控制,确保大型语言模型(LLM)服务的稳定性和可靠性。
查看详情
生产级AI模型部署架构
together-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
333
这是一套用于构建可扩展、高可用、成本高效的AI服务层的参考架构。它涵盖了完整的AI生命周期管理,包括智能模型路由(实现成本与性能的权衡)、响应缓存、异步批量处理和模型微调管线管理。适用于需要跨多个开源模型提供高可用性的企业级应用。
查看详情
AI项目治理与可行性评估
caio-review
alirezarezvani/claude-skills
388
这是一个模拟首席AI官(CAIO)的严格审查流程,用于评估任何涉及AI的商业计划。在使用AI功能前,该工具强制要求用户评估六个核心维度:效果评估标准、幻觉和错误率风险、欧盟AI法合规性、模型构建方案(API/自建)、成本经济性以及所需团队配置。确保AI项目落地安全、合规且具有经济可行性。
查看详情
上一页
1
2
3
语言
简体中文
English