登录
下载
Skill UI
浏览并发现
9987+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
成本管理
,共找到
16
条记录
默认排序
最新上传
最多下载
上下文优化策略
context-optimization
sickn33/antigravity-awesome-skills
293
本技能提供了一套高级的LLM上下文管理框架,旨在提升有限上下文窗口的有效容量。它涵盖了压缩、观测屏蔽、KV缓存优化和上下文分区等四种核心技术。通过优化Token使用,可以有效解决上下文限制问题,帮助构建成本更低、延迟更小、能处理大规模文档和复杂任务的生产级AI Agent系统。
查看详情
Cursor AI模型密钥配置管理
cursor-api-key-management
jeremylongshore/claude-code-plugins-plus-skills
130
本指南详细介绍了如何在Cursor编辑器中配置“自带密钥”(BYOK)功能,以连接OpenAI、Anthropic、Google Gemini、Azure等主流AI模型服务。用户可以通过配置自己的API密钥来绕过默认配额限制,实现成本的直接管理,并确保可以访问所需的专业级模型。内容涵盖了配置步骤、安全最佳实践和成本监控。
查看详情
Langfuse 观测平台
langfuse
sickn33/antigravity-awesome-skills
134
Langfuse 提供完整的 LLM 观测能力,涵盖调用追踪、提示管理、评估打分与成本/延迟/质量监控,适用于与 LangChain、LlamaIndex、OpenAI 等集成的生产场景。
查看详情
Langfuse LLM成本监控与优化
langfuse-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
281
本指南展示如何利用Langfuse强大的分析功能,实现大型语言模型(LLM)的成本监控、分析与优化。内容涵盖自动令牌使用量跟踪、通过Metrics API获取成本报告,以及实现智能模型路由,根据任务复杂度和输入长度自动选择最具成本效益的模型。适用于需要管理AI预算、控制LLM支出和提升系统效率的开发团队。
查看详情
OpenRouter大型语言模型API快速入门
openrouter-hello-world
jeremylongshore/claude-code-plugins-plus-skills
219
该指南提供了一个完整的OpenRouter快速入门教程,用于接入多个大型语言模型(LLM)的统一API入口。内容包含cURL、Python和TypeScript示例,指导用户如何发送聊天补全请求、处理JSON响应、管理模型参数,并计算跨不同模型的调用成本。适用于需要测试API连接或构建多模型应用(如Llama、GPT-4o)的开发人员。
查看详情
Retell AI 语音代理成本管理
retellai-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
94
本技能提供了Retell AI语音代理和电话系统平台的成本优化实现模式。适用于开发或优化依赖语音通信的自动化系统,帮助开发者有效管理和监控API资源使用成本,确保AI语音系统的资源使用效率。
查看详情
Vast.ai GPU生产级部署检查表
vastai-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
307
这份清单旨在指导用户在Vast.ai上部署大规模、生产级的GPU工作负载。它系统性地覆盖了从账户认证、实例选型、数据加密、检查点管理、到处理竞价实例中断、成本控制及性能监控等所有关键步骤,确保深度学习任务的稳定可靠运行。
查看详情
Vast.ai GPU资源租用管理
vast-gpu
wanshuiyin/Auto-claude-code-research-in-sleep
494
该技能用于管理、配置和销毁vast.ai上的GPU实例。它能深入分析您的深度学习任务,自动确定精确的硬件需求(如显存、GPU数量、存储空间),并搜索到最具成本效益、高可靠性的GPU资源。从任务分析到实验监控,全程管理GPU生命周期,确保您以最低成本租用到所需资源。
查看详情
Anthropic Claude成本优化指南
anth-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
393
本指南提供了优化Anthropic Claude API使用成本的全面策略。涵盖了模型路由(根据任务选择最经济的模型)、提示词缓存(减少重复输入成本)、批量处理(处理异步任务)以及实时支出跟踪与预算预警。适用于需要管理大规模、高成本AI应用部署和精确预算控制的场景。
查看详情
大型语言模型安全防护层
anth-policy-guardrails
jeremylongshore/claude-code-plugins-plus-skills
247
该技能提供了一套完整的AI应用级安全防护机制。它用于增强与Claude等大型语言模型API的集成安全性,覆盖输入数据(如PII检测、长度)校验、系统提示词(Scope)限制、输出结果敏感信息过滤、成本预算控制以及模型访问权限管理,确保AI应用的可靠性和合规性。
查看详情
Cohere成本优化与用量控制
cohere-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
104
本技能集提供了管理和优化 Cohere API 成本的综合策略。它指导用户如何通过模型分级、设置Token预算、优化Embedding存储以及建立实时用量监控系统,有效控制AI应用运行的API开销,确保成本可预测性。
查看详情
Cohere API性能调优指南
cohere-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
466
本指南提供全面的Cohere API v2性能优化策略。旨在帮助用户优化Chat、Embed和Rerank等核心API的使用效率,显著提高API吞吐量、降低延迟和管理成本。核心技术包括根据延迟预算选择最佳模型、实现流式传输(Streaming)以提升用户体验、高效批量嵌入(Batching)处理、向量压缩以及部署缓存机制。
查看详情
1
2
下一页
语言
简体中文
English