登录
下载
Skill UI
浏览并发现
9688+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
预算管理
,共找到
10
条记录
默认排序
最新上传
最多下载
大模型上下文工程基础
context-fundamentals
sickn33/antigravity-awesome-skills
223
本技能深入讲解了大型语言模型(LLMs)推理时可用的完整状态(上下文)。内容涵盖系统提示、工具定义、消息历史记录和检索文档等核心组件。掌握上下文工程是构建稳定、高效AI智能体的关键,它指导用户如何优化上下文内容,管理注意力预算,确保模型接收到最相关的“高信号”信息。
查看详情
大型语言模型上下文管理
context-window-management
sickn33/antigravity-awesome-skills
86
本技能集提供了一套高级的、结构化的LLM上下文管理策略。内容涵盖了智能总结、动态修剪、上下文路由和Token预算分配,旨在有效防止“上下文衰退”。它是构建复杂、长流程、多轮对话式AI系统的关键技术。
查看详情
Exa搜索结果处理与RAG上下文管理
exa-data-handling
jeremylongshore/claude-code-plugins-plus-skills
186
用于处理和优化来自Exa搜索API的原始搜索结果。该技能提供对内容提取范围的全面控制,支持选择元数据、高亮、全文或结构化摘要。核心功能包括实现带时效性的结果缓存、引用去重,以及最关键的基于令牌预算的内容筛选,确保检索内容能适配大型语言模型(LLM)的上下文窗口,是构建高级RAG和知识检索系统的关键工具。
查看详情
Langfuse LLM成本监控与优化
langfuse-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
281
本指南展示如何利用Langfuse强大的分析功能,实现大型语言模型(LLM)的成本监控、分析与优化。内容涵盖自动令牌使用量跟踪、通过Metrics API获取成本报告,以及实现智能模型路由,根据任务复杂度和输入长度自动选择最具成本效益的模型。适用于需要管理AI预算、控制LLM支出和提升系统效率的开发团队。
查看详情
上下文预算与LLM优化
context-budget
affaan-m/everything-claude-code
85
本工具用于审计Claude Code会话中所有组件(如代理、技能、规则和MCP服务器)的Token消耗。它能分析上下文开销,识别冗余或臃肿的组件,并生成详细的上下文预算报告。帮助用户管理Token使用量,确保模型运行效率和性能。
查看详情
Anthropic Claude成本优化指南
anth-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
393
本指南提供了优化Anthropic Claude API使用成本的全面策略。涵盖了模型路由(根据任务选择最经济的模型)、提示词缓存(减少重复输入成本)、批量处理(处理异步任务)以及实时支出跟踪与预算预警。适用于需要管理大规模、高成本AI应用部署和精确预算控制的场景。
查看详情
大型语言模型安全防护层
anth-policy-guardrails
jeremylongshore/claude-code-plugins-plus-skills
247
该技能提供了一套完整的AI应用级安全防护机制。它用于增强与Claude等大型语言模型API的集成安全性,覆盖输入数据(如PII检测、长度)校验、系统提示词(Scope)限制、输出结果敏感信息过滤、成本预算控制以及模型访问权限管理,确保AI应用的可靠性和合规性。
查看详情
Cohere成本优化与用量控制
cohere-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
104
本技能集提供了管理和优化 Cohere API 成本的综合策略。它指导用户如何通过模型分级、设置Token预算、优化Embedding存储以及建立实时用量监控系统,有效控制AI应用运行的API开销,确保成本可预测性。
查看详情
Cohere API性能调优指南
cohere-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
466
本指南提供全面的Cohere API v2性能优化策略。旨在帮助用户优化Chat、Embed和Rerank等核心API的使用效率,显著提高API吞吐量、降低延迟和管理成本。核心技术包括根据延迟预算选择最佳模型、实现流式传输(Streaming)以提升用户体验、高效批量嵌入(Batching)处理、向量压缩以及部署缓存机制。
查看详情
上下文修剪与令牌预算管理
recursive-context-pruning-token-budgeting
sickn33/antigravity-awesome-skills
411
该技能通过实现“守门人”逻辑,优化了AI代理在长期工作流中的性能。它通过分片元数据、分配令牌预算,并强制采用原子精度,防止上下文窗口膨胀,确保输出结果纯粹、简洁、可执行。特别适用于复杂的编程、多步骤推理和大型文档分析等场景。
查看详情
1
语言
简体中文
English