下载

Skill UI

浏览并发现 9987+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索成本管理，共找到 16 条记录

默认排序最新上传最多下载

上下文优化策略

context-optimization

sickn33/antigravity-awesome-skills

本技能提供了一套高级的LLM上下文管理框架，旨在提升有限上下文窗口的有效容量。它涵盖了压缩、观测屏蔽、KV缓存优化和上下文分区等四种核心技术。通过优化Token使用，可以有效解决上下文限制问题，帮助构建成本更低、延迟更小、能处理大规模文档和复杂任务的生产级AI Agent系统。

Cursor AI模型密钥配置管理

cursor-api-key-management

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了如何在Cursor编辑器中配置“自带密钥”（BYOK）功能，以连接OpenAI、Anthropic、Google Gemini、Azure等主流AI模型服务。用户可以通过配置自己的API密钥来绕过默认配额限制，实现成本的直接管理，并确保可以访问所需的专业级模型。内容涵盖了配置步骤、安全最佳实践和成本监控。

Langfuse 观测平台

sickn33/antigravity-awesome-skills

Langfuse 提供完整的 LLM 观测能力，涵盖调用追踪、提示管理、评估打分与成本/延迟/质量监控，适用于与 LangChain、LlamaIndex、OpenAI 等集成的生产场景。

Langfuse LLM成本监控与优化

langfuse-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南展示如何利用Langfuse强大的分析功能，实现大型语言模型（LLM）的成本监控、分析与优化。内容涵盖自动令牌使用量跟踪、通过Metrics API获取成本报告，以及实现智能模型路由，根据任务复杂度和输入长度自动选择最具成本效益的模型。适用于需要管理AI预算、控制LLM支出和提升系统效率的开发团队。

OpenRouter大型语言模型API快速入门

openrouter-hello-world

jeremylongshore/claude-code-plugins-plus-skills

该指南提供了一个完整的OpenRouter快速入门教程，用于接入多个大型语言模型（LLM）的统一API入口。内容包含cURL、Python和TypeScript示例，指导用户如何发送聊天补全请求、处理JSON响应、管理模型参数，并计算跨不同模型的调用成本。适用于需要测试API连接或构建多模型应用（如Llama、GPT-4o）的开发人员。

Retell AI 语音代理成本管理

retellai-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本技能提供了Retell AI语音代理和电话系统平台的成本优化实现模式。适用于开发或优化依赖语音通信的自动化系统，帮助开发者有效管理和监控API资源使用成本，确保AI语音系统的资源使用效率。

Vast.ai GPU生产级部署检查表

vastai-prod-checklist

jeremylongshore/claude-code-plugins-plus-skills

这份清单旨在指导用户在Vast.ai上部署大规模、生产级的GPU工作负载。它系统性地覆盖了从账户认证、实例选型、数据加密、检查点管理、到处理竞价实例中断、成本控制及性能监控等所有关键步骤，确保深度学习任务的稳定可靠运行。

Vast.ai GPU资源租用管理

wanshuiyin/Auto-claude-code-research-in-sleep

该技能用于管理、配置和销毁vast.ai上的GPU实例。它能深入分析您的深度学习任务，自动确定精确的硬件需求（如显存、GPU数量、存储空间），并搜索到最具成本效益、高可靠性的GPU资源。从任务分析到实验监控，全程管理GPU生命周期，确保您以最低成本租用到所需资源。

Anthropic Claude成本优化指南

anth-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了优化Anthropic Claude API使用成本的全面策略。涵盖了模型路由（根据任务选择最经济的模型）、提示词缓存（减少重复输入成本）、批量处理（处理异步任务）以及实时支出跟踪与预算预警。适用于需要管理大规模、高成本AI应用部署和精确预算控制的场景。

大型语言模型安全防护层

anth-policy-guardrails

jeremylongshore/claude-code-plugins-plus-skills

该技能提供了一套完整的AI应用级安全防护机制。它用于增强与Claude等大型语言模型API的集成安全性，覆盖输入数据（如PII检测、长度）校验、系统提示词（Scope）限制、输出结果敏感信息过滤、成本预算控制以及模型访问权限管理，确保AI应用的可靠性和合规性。

Cohere成本优化与用量控制

cohere-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本技能集提供了管理和优化 Cohere API 成本的综合策略。它指导用户如何通过模型分级、设置Token预算、优化Embedding存储以及建立实时用量监控系统，有效控制AI应用运行的API开销，确保成本可预测性。

Cohere API性能调优指南

cohere-performance-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南提供全面的Cohere API v2性能优化策略。旨在帮助用户优化Chat、Embed和Rerank等核心API的使用效率，显著提高API吞吐量、降低延迟和管理成本。核心技术包括根据延迟预算选择最佳模型、实现流式传输（Streaming）以提升用户体验、高效批量嵌入（Batching）处理、向量压缩以及部署缓存机制。

语言