登录
下载
Skill UI
浏览并发现
9677+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
CAC
,共找到
25
条记录
默认排序
最新上传
最多下载
上下文优化策略
context-optimization
sickn33/antigravity-awesome-skills
293
本技能提供了一套高级的LLM上下文管理框架,旨在提升有限上下文窗口的有效容量。它涵盖了压缩、观测屏蔽、KV缓存优化和上下文分区等四种核心技术。通过优化Token使用,可以有效解决上下文限制问题,帮助构建成本更低、延迟更小、能处理大规模文档和复杂任务的生产级AI Agent系统。
查看详情
Exa搜索结果处理与RAG上下文管理
exa-data-handling
jeremylongshore/claude-code-plugins-plus-skills
186
用于处理和优化来自Exa搜索API的原始搜索结果。该技能提供对内容提取范围的全面控制,支持选择元数据、高亮、全文或结构化摘要。核心功能包括实现带时效性的结果缓存、引用去重,以及最关键的基于令牌预算的内容筛选,确保检索内容能适配大型语言模型(LLM)的上下文窗口,是构建高级RAG和知识检索系统的关键工具。
查看详情
优化 Ideogram API 成本
ideogram-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
341
本技能提供了一套完整的 Ideogram API 成本优化方案。它指导用户通过模型分级选择、批量调用、缓存提示词和设置预算监控,极大地降低图像生成成本。适用于需要进行大规模、高频率 AI 图像创作的开发者。
查看详情
LangChain/LangGraph智能体开发专家
llm-application-dev-langchain-agent
sickn33/antigravity-awesome-skills
272
该技能旨在提供构建生产级、复杂AI智能体系统的专家指导。它专注于使用最新LangChain 0.1+和LangGraph API,实现多智能体编排、高级检索增强生成(RAG)流程(如RAG Fusion、HyDE)和复杂的状态管理。内容覆盖从架构设计到生产部署的全周期,包括FastAPI流式API、LangSmith可观测性、缓存优化及健壮的错误处理机制。
查看详情
Mamba选择性状态空间模型
mamba-architecture
Orchestra-Research/AI-Research-SKILLs
59
Mamba 是选择性状态空间架构,提供 Mamba-1 与 Mamba-2,可用 O(n) 复杂度处理百万级序列,节省显存、适配硬件、替代 Transformer 生成任务。
查看详情
Mistral AI API性能调优指南
mistral-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
65
本指南提供一套全面的Mistral AI API性能优化框架。内容涵盖模型选型、响应流式传输(Streaming)、请求缓存、并发控制到提示词优化等高级技术。帮助开发者解决API响应慢、吞吐量不足等问题,实现高效、低延迟、高稳定性的AI应用集成,是构建生产级AI系统的必备知识。
查看详情
LLM上下文优化与API使用
openrouter-context-optimization
jeremylongshore/claude-code-plugins-plus-skills
153
本技能提供了一套针对大型语言模型(LLM)在OpenRouter平台上的上下文窗口和Token使用优化策略。它涵盖了上下文限额查询、模型选择、对话截断、文档分块(RAG)和提示缓存等方面。适用于处理长篇对话或大型文档,帮助用户在上下文受限时,既能保证输出质量,又能有效控制API成本,防止超出Token限制。
查看详情
Perplexity数据处理与优化
perplexity-data-handling
jeremylongshore/claude-code-plugins-plus-skills
94
本技能旨在管理Perplexity搜索工作流中的复杂数据流。它实现了关键的安全功能,如查询中的个人身份信息(PII)脱敏,用于验证外部引用源的准确性,通过设置数据新鲜度策略进行结果缓存优化,并管理对话上下文,确保AI应用的健壮性、合规性与高可靠性。
查看详情
Perplexity云平台部署集成指南
perplexity-deploy-integration
jeremylongshore/claude-code-plugins-plus-skills
244
本指南提供了使用 Perplexity Sonar API 构建和部署应用的完整流程。涵盖了 Vercel、Cloud Run 和 Docker 等主流云平台的部署配置,支持构建生产就绪的API端点。用户可以管理API密钥、利用边缘函数和Redis缓存,确保应用在高可用性和高性能方面达到最佳效果。
查看详情
AI驱动的研究架构设计
perplexity-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
278
本技能提供了一套完整的、模仿Perplexity的AI搜索和研究系统参考架构。它涵盖了搜索服务(模型路由、缓存)、引用文献处理(提取、验证)和研究编排器(多查询合成)三个核心模块,适用于构建复杂的、增强搜索能力的AI应用和系统设计。
查看详情
LLM 提示缓存方案
prompt-caching
sickn33/antigravity-awesome-skills
295
介绍 Claude、OpenAI 等 LLM 的提示与响应缓存,以及 CAG 模式,用稳定上下文复用减少重复调用,降低延迟与费用。
查看详情
SGLang 结构化推理服务
sglang
Orchestra-Research/AI-Research-SKILLs
150
SGLang 是面向 LLM/VLM 的高性能服务框架,采用 RadixAttention 前缀缓存实现 JSON/正则/语法结构化输出、函数调用型代理流程,并在多 GPU 生产环境中比 vLLM 快 5 倍。
查看详情
1
2
3
下一页
语言
简体中文
English