下载

Skill UI

浏览并发现 9688+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索预算管理，共找到 10 条记录

默认排序最新上传最多下载

大模型上下文工程基础

context-fundamentals

sickn33/antigravity-awesome-skills

本技能深入讲解了大型语言模型（LLMs）推理时可用的完整状态（上下文）。内容涵盖系统提示、工具定义、消息历史记录和检索文档等核心组件。掌握上下文工程是构建稳定、高效AI智能体的关键，它指导用户如何优化上下文内容，管理注意力预算，确保模型接收到最相关的“高信号”信息。

大型语言模型上下文管理

context-window-management

sickn33/antigravity-awesome-skills

本技能集提供了一套高级的、结构化的LLM上下文管理策略。内容涵盖了智能总结、动态修剪、上下文路由和Token预算分配，旨在有效防止“上下文衰退”。它是构建复杂、长流程、多轮对话式AI系统的关键技术。

Exa搜索结果处理与RAG上下文管理

exa-data-handling

jeremylongshore/claude-code-plugins-plus-skills

用于处理和优化来自Exa搜索API的原始搜索结果。该技能提供对内容提取范围的全面控制，支持选择元数据、高亮、全文或结构化摘要。核心功能包括实现带时效性的结果缓存、引用去重，以及最关键的基于令牌预算的内容筛选，确保检索内容能适配大型语言模型（LLM）的上下文窗口，是构建高级RAG和知识检索系统的关键工具。

Langfuse LLM成本监控与优化

langfuse-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南展示如何利用Langfuse强大的分析功能，实现大型语言模型（LLM）的成本监控、分析与优化。内容涵盖自动令牌使用量跟踪、通过Metrics API获取成本报告，以及实现智能模型路由，根据任务复杂度和输入长度自动选择最具成本效益的模型。适用于需要管理AI预算、控制LLM支出和提升系统效率的开发团队。

上下文预算与LLM优化

affaan-m/everything-claude-code

本工具用于审计Claude Code会话中所有组件（如代理、技能、规则和MCP服务器）的Token消耗。它能分析上下文开销，识别冗余或臃肿的组件，并生成详细的上下文预算报告。帮助用户管理Token使用量，确保模型运行效率和性能。

Anthropic Claude成本优化指南

anth-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了优化Anthropic Claude API使用成本的全面策略。涵盖了模型路由（根据任务选择最经济的模型）、提示词缓存（减少重复输入成本）、批量处理（处理异步任务）以及实时支出跟踪与预算预警。适用于需要管理大规模、高成本AI应用部署和精确预算控制的场景。

大型语言模型安全防护层

anth-policy-guardrails

jeremylongshore/claude-code-plugins-plus-skills

该技能提供了一套完整的AI应用级安全防护机制。它用于增强与Claude等大型语言模型API的集成安全性，覆盖输入数据（如PII检测、长度）校验、系统提示词（Scope）限制、输出结果敏感信息过滤、成本预算控制以及模型访问权限管理，确保AI应用的可靠性和合规性。

Cohere成本优化与用量控制

cohere-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本技能集提供了管理和优化 Cohere API 成本的综合策略。它指导用户如何通过模型分级、设置Token预算、优化Embedding存储以及建立实时用量监控系统，有效控制AI应用运行的API开销，确保成本可预测性。

Cohere API性能调优指南

cohere-performance-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南提供全面的Cohere API v2性能优化策略。旨在帮助用户优化Chat、Embed和Rerank等核心API的使用效率，显著提高API吞吐量、降低延迟和管理成本。核心技术包括根据延迟预算选择最佳模型、实现流式传输（Streaming）以提升用户体验、高效批量嵌入（Batching）处理、向量压缩以及部署缓存机制。

上下文修剪与令牌预算管理

recursive-context-pruning-token-budgeting

sickn33/antigravity-awesome-skills

该技能通过实现“守门人”逻辑，优化了AI代理在长期工作流中的性能。它通过分片元数据、分配令牌预算，并强制采用原子精度，防止上下文窗口膨胀，确保输出结果纯粹、简洁、可执行。特别适用于复杂的编程、多步骤推理和大型文档分析等场景。

1

语言