下载

Skill UI

浏览并发现 9979+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索缓存，共找到 24 条记录

默认排序最新上传最多下载

变换器机制可解释性分析

transformer-lens-interpretability

Orchestra-Research/AI-Research-SKILLs

这是一个用于大型语言模型的机制可解释性研究库。它允许用户通过HookPoints和激活缓存来深入检查和操作Transformer模型的内部机制，例如注意力模式、残差流和MLP输出。该工具对于逆向工程模型算法、执行因果追踪和分析模型内部电路至关重要。

Claude API 使用指南

affaan-m/everything-claude-code

涵盖 Python 与 TypeScript SDK 上的 Claude API 集成方案，讲解消息、流式、工具调用、视觉解析、扩展思考、提示缓存、批量处理与 Agent 工作流，帮助构建高效低成本的 Anthropic Claude 应用。

LLM成本优化与架构设计

llm-cost-optimizer

alirezarezvani/claude-skills

提供专业的LLM成本优化框架，帮助开发者通过模型路由、提示词缓存、输出长度控制和压缩等技术，系统性地降低AI API支出（可达40-80%）。旨在确保在成本受到严格控制的前提下，维持高质量、可扩展的AI功能。

代码会话使用分析报告

anthropics/claude-plugins-official

该工具生成一份可交互的HTML报告，用于详细分析Claude Code会话的使用指标。它追踪了Token消耗（输入/输出）、子代理调用、技能使用和缓存效率等关键数据。帮助开发者直观地了解资源消耗，识别工作流中的效率瓶颈和潜在的优化点，实现更经济高效的AI开发。

Anthropic Claude成本优化指南

anth-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了优化Anthropic Claude API使用成本的全面策略。涵盖了模型路由（根据任务选择最经济的模型）、提示词缓存（减少重复输入成本）、批量处理（处理异步任务）以及实时支出跟踪与预算预警。适用于需要管理大规模、高成本AI应用部署和精确预算控制的场景。

Anthropic API成本优化指南

clade-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了在使用Anthropic Claude API时降低成本的专业策略。内容涵盖了根据任务复杂度选择合适的模型（Haiku, Sonnet, Opus）、实施提示词缓存、利用消息批量处理，以及高效的令牌数量削减技巧，帮助开发者构建成本效益更高的AI应用。

AssemblyAI转录性能优化指南

assemblyai-performance-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了优化AssemblyAI转录性能的全面高级策略。涵盖了如何最大化处理吞吐量和最小化延迟，指导用户实现缓存机制、使用Webhook替代轮询、根据需求选择最佳模型，以及高效并行处理大规模批次任务。

Anthropic Claude SDK 最佳实践

clade-sdk-patterns

jeremylongshore/claude-code-plugins-plus-skills

本指南提供了使用 Anthropic Claude API 的生产级最佳实践模式。它覆盖了TypeScript和Python客户端的配置、健壮的错误处理机制、各种流式传输实现、提示缓存以及批量任务处理，帮助开发者构建高性能、高可靠性的AI应用。

Claude持久记忆知识库

claude-memory-kit

rohitg00/awesome-claude-code-toolkit

这是一个为Claude AI智能体设计的持久化记忆系统。它采用双层架构（热缓存和知识维基），能够跨会话和多个项目维护复杂的上下文记忆。系统支持多项目隔离和安全捕获机制，并提供/close-day命令进行每日内容总结，确保AI持续学习，不会遗忘先前的信息和经验。

Cohere API性能调优指南

cohere-performance-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南提供全面的Cohere API v2性能优化策略。旨在帮助用户优化Chat、Embed和Rerank等核心API的使用效率，显著提高API吞吐量、降低延迟和管理成本。核心技术包括根据延迟预算选择最佳模型、实现流式传输（Streaming）以提升用户体验、高效批量嵌入（Batching）处理、向量压缩以及部署缓存机制。

Together AI成本调优指南

together-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南提供一套全面的成本优化方案，用于在使用Together AI的OpenAI兼容API时管理和降低支出。内容涵盖推理（inference）、微调（fine-tuning）和模型部署等多个环节的最佳实践。用户可以学习如何根据需求选择合适的模型规模、利用缓存和批量推理等技术，从而在保证性能的同时，最小化AI运行成本。

生产级AI模型部署架构

together-reference-architecture

jeremylongshore/claude-code-plugins-plus-skills

这是一套用于构建可扩展、高可用、成本高效的AI服务层的参考架构。它涵盖了完整的AI生命周期管理，包括智能模型路由（实现成本与性能的权衡）、响应缓存、异步批量处理和模型微调管线管理。适用于需要跨多个开源模型提供高可用性的企业级应用。

语言