下载

Skill UI

浏览并发现 9183+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索大型语言模型，共找到 39 条记录

默认排序最新上传最多下载

大语言模型智能体评估

agent-evaluation

sickn33/antigravity-awesome-skills

这是一个用于全面测试和评估大型语言模型（LLM）智能体的框架。它超越了简单的通过/失败判断，深入评估智能体的复杂行为、可靠性指标和能力一致性。适用于生产环境的监控，帮助识别高级AI智能体中的微妙故障模式。

模型上下文衰减模式

context-degradation

sickn33/antigravity-awesome-skills

本技能深入解析大型语言模型在处理长上下文时，性能衰退的几种可预测模式。内容覆盖了“中心信息遗忘”、“上下文污染”、“信息干扰”等核心现象。帮助开发者诊断AI代理的性能瓶颈，并指导如何设计出更健壮、更可靠的长文本处理系统。

大模型上下文工程基础

context-fundamentals

sickn33/antigravity-awesome-skills

本技能深入讲解了大型语言模型（LLMs）推理时可用的完整状态（上下文）。内容涵盖系统提示、工具定义、消息历史记录和检索文档等核心组件。掌握上下文工程是构建稳定、高效AI智能体的关键，它指导用户如何优化上下文内容，管理注意力预算，确保模型接收到最相关的“高信号”信息。

大型语言模型上下文管理

context-window-management

sickn33/antigravity-awesome-skills

本技能集提供了一套高级的、结构化的LLM上下文管理策略。内容涵盖了智能总结、动态修剪、上下文路由和Token预算分配，旨在有效防止“上下文衰退”。它是构建复杂、长流程、多轮对话式AI系统的关键技术。

代码模型评估与基准测试

evaluating-code-models

Orchestra-Research/AI-Research-SKILLs

本工具箱用于全面评估代码生成模型的性能。它支持针对HumanEval、MBPP、MultiPL-E等行业标准进行多语言基准测试。可量化比较不同大型语言模型（LLM）的编码能力，通过pass@k指标衡量代码生成质量。

Exa搜索结果处理与RAG上下文管理

exa-data-handling

jeremylongshore/claude-code-plugins-plus-skills

用于处理和优化来自Exa搜索API的原始搜索结果。该技能提供对内容提取范围的全面控制，支持选择元数据、高亮、全文或结构化摘要。核心功能包括实现带时效性的结果缓存、引用去重，以及最关键的基于令牌预算的内容筛选，确保检索内容能适配大型语言模型（LLM）的上下文窗口，是构建高级RAG和知识检索系统的关键工具。

大型语言模型（LLM）实现与训练

implementing-llms-litgpt

Orchestra-Research/AI-Research-SKILLs

LitGPT提供了一个用于实现和训练超过20种前沿大型语言模型（如Llama, Gemma, Mistral）的工具。它支持完整的微调（Fine-tuning）、高效的LoRA适配以及从零开始的预训练流程。适用于需要清晰模型结构、学术理解或生产级部署的开发者。

知识蒸馏：大模型压缩

knowledge-distillation

Orchestra-Research/AI-Research-SKILLs

知识蒸馏（KD）是一种核心的AI模型压缩技术。它旨在将性能强大的大型语言模型（Teacher）的知识，高效地转移给更小、更易于部署的学生模型（Student）。这使得开发者能够在不损失关键性能的前提下，大幅降低推理成本，实现将前沿大模型能力落地到实际应用场景。

LangChain LLM应用架构指南

langchain-architecture

sickn33/antigravity-awesome-skills

本指南深入讲解LangChain框架，帮助用户掌握构建复杂、生产级大型语言模型（LLM）应用程序的完整能力。内容涵盖自驱代理（Agents）、链式调用（Chains）、记忆管理、检索增强生成（RAG）以及外部工具集成等核心模块，全面助力构建智能AI系统。

LangChain SDK安装与身份验证

langchain-install-auth

jeremylongshore/claude-code-plugins-plus-skills

本指南详细介绍了LangChain SDK在Python和Node.js环境中的安装流程。它指导用户配置核心依赖包，并安全地设置OpenAI、Anthropic和Google等主流大型语言模型（LLM）提供商的API密钥，是启动任何LLM应用开发项目的必备步骤。

Langfuse CI/CD：LLM质量测试集成

langfuse-ci-integration

jeremylongshore/claude-code-plugins-plus-skills

本指南展示如何将Langfuse集成到CI/CD流水线（例如GitHub Actions）中，用于自动化大型语言模型（LLM）的质量测试。用户可以实现提示词回归测试、调用链验证和实验驱动的质量门禁，确保AI应用的稳定性和性能。

Langfuse LLM 调用可观测性

langfuse-core-workflow-a

jeremylongshore/claude-code-plugins-plus-skills

本工作流展示了如何使用 Langfuse 为大型语言模型（LLM）调用、链式调用和复杂 Agent 实现端到端的完整追踪。它覆盖了包括 OpenAI 包装器、RAG 流程的手动 Span 追踪、流式响应监控以及多模型（如 OpenAI, Anthropic）的集成。适用于需要深入了解 AI 系统性能、调试复杂流程和监控生产环境 LLM 使用情况的场景。

12 3 4 下一页

语言