登录
下载
Skill UI
浏览并发现
9979+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
缓存
,共找到
24
条记录
默认排序
最新上传
最多下载
变换器机制可解释性分析
transformer-lens-interpretability
Orchestra-Research/AI-Research-SKILLs
259
这是一个用于大型语言模型的机制可解释性研究库。它允许用户通过HookPoints和激活缓存来深入检查和操作Transformer模型的内部机制,例如注意力模式、残差流和MLP输出。该工具对于逆向工程模型算法、执行因果追踪和分析模型内部电路至关重要。
查看详情
Claude API 使用指南
claude-api
affaan-m/everything-claude-code
223
涵盖 Python 与 TypeScript SDK 上的 Claude API 集成方案,讲解消息、流式、工具调用、视觉解析、扩展思考、提示缓存、批量处理与 Agent 工作流,帮助构建高效低成本的 Anthropic Claude 应用。
查看详情
LLM成本优化与架构设计
llm-cost-optimizer
alirezarezvani/claude-skills
446
提供专业的LLM成本优化框架,帮助开发者通过模型路由、提示词缓存、输出长度控制和压缩等技术,系统性地降低AI API支出(可达40-80%)。旨在确保在成本受到严格控制的前提下,维持高质量、可扩展的AI功能。
查看详情
代码会话使用分析报告
session-report
anthropics/claude-plugins-official
267
该工具生成一份可交互的HTML报告,用于详细分析Claude Code会话的使用指标。它追踪了Token消耗(输入/输出)、子代理调用、技能使用和缓存效率等关键数据。帮助开发者直观地了解资源消耗,识别工作流中的效率瓶颈和潜在的优化点,实现更经济高效的AI开发。
查看详情
Anthropic Claude成本优化指南
anth-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
393
本指南提供了优化Anthropic Claude API使用成本的全面策略。涵盖了模型路由(根据任务选择最经济的模型)、提示词缓存(减少重复输入成本)、批量处理(处理异步任务)以及实时支出跟踪与预算预警。适用于需要管理大规模、高成本AI应用部署和精确预算控制的场景。
查看详情
Anthropic API成本优化指南
clade-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
227
本指南详细介绍了在使用Anthropic Claude API时降低成本的专业策略。内容涵盖了根据任务复杂度选择合适的模型(Haiku, Sonnet, Opus)、实施提示词缓存、利用消息批量处理,以及高效的令牌数量削减技巧,帮助开发者构建成本效益更高的AI应用。
查看详情
AssemblyAI转录性能优化指南
assemblyai-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
62
本指南提供了优化AssemblyAI转录性能的全面高级策略。涵盖了如何最大化处理吞吐量和最小化延迟,指导用户实现缓存机制、使用Webhook替代轮询、根据需求选择最佳模型,以及高效并行处理大规模批次任务。
查看详情
Anthropic Claude SDK 最佳实践
clade-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
231
本指南提供了使用 Anthropic Claude API 的生产级最佳实践模式。它覆盖了TypeScript和Python客户端的配置、健壮的错误处理机制、各种流式传输实现、提示缓存以及批量任务处理,帮助开发者构建高性能、高可靠性的AI应用。
查看详情
Claude持久记忆知识库
claude-memory-kit
rohitg00/awesome-claude-code-toolkit
440
这是一个为Claude AI智能体设计的持久化记忆系统。它采用双层架构(热缓存和知识维基),能够跨会话和多个项目维护复杂的上下文记忆。系统支持多项目隔离和安全捕获机制,并提供/close-day命令进行每日内容总结,确保AI持续学习,不会遗忘先前的信息和经验。
查看详情
Cohere API性能调优指南
cohere-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
466
本指南提供全面的Cohere API v2性能优化策略。旨在帮助用户优化Chat、Embed和Rerank等核心API的使用效率,显著提高API吞吐量、降低延迟和管理成本。核心技术包括根据延迟预算选择最佳模型、实现流式传输(Streaming)以提升用户体验、高效批量嵌入(Batching)处理、向量压缩以及部署缓存机制。
查看详情
Together AI成本调优指南
together-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
122
本指南提供一套全面的成本优化方案,用于在使用Together AI的OpenAI兼容API时管理和降低支出。内容涵盖推理(inference)、微调(fine-tuning)和模型部署等多个环节的最佳实践。用户可以学习如何根据需求选择合适的模型规模、利用缓存和批量推理等技术,从而在保证性能的同时,最小化AI运行成本。
查看详情
生产级AI模型部署架构
together-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
333
这是一套用于构建可扩展、高可用、成本高效的AI服务层的参考架构。它涵盖了完整的AI生命周期管理,包括智能模型路由(实现成本与性能的权衡)、响应缓存、异步批量处理和模型微调管线管理。适用于需要跨多个开源模型提供高可用性的企业级应用。
查看详情
上一页
1
2
语言
简体中文
English