登录
下载
Skill UI
浏览并发现
9183+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
大型语言模型
,共找到
39
条记录
默认排序
最新上传
最多下载
大语言模型智能体评估
agent-evaluation
sickn33/antigravity-awesome-skills
271
这是一个用于全面测试和评估大型语言模型(LLM)智能体的框架。它超越了简单的通过/失败判断,深入评估智能体的复杂行为、可靠性指标和能力一致性。适用于生产环境的监控,帮助识别高级AI智能体中的微妙故障模式。
查看详情
模型上下文衰减模式
context-degradation
sickn33/antigravity-awesome-skills
100
本技能深入解析大型语言模型在处理长上下文时,性能衰退的几种可预测模式。内容覆盖了“中心信息遗忘”、“上下文污染”、“信息干扰”等核心现象。帮助开发者诊断AI代理的性能瓶颈,并指导如何设计出更健壮、更可靠的长文本处理系统。
查看详情
大模型上下文工程基础
context-fundamentals
sickn33/antigravity-awesome-skills
223
本技能深入讲解了大型语言模型(LLMs)推理时可用的完整状态(上下文)。内容涵盖系统提示、工具定义、消息历史记录和检索文档等核心组件。掌握上下文工程是构建稳定、高效AI智能体的关键,它指导用户如何优化上下文内容,管理注意力预算,确保模型接收到最相关的“高信号”信息。
查看详情
大型语言模型上下文管理
context-window-management
sickn33/antigravity-awesome-skills
86
本技能集提供了一套高级的、结构化的LLM上下文管理策略。内容涵盖了智能总结、动态修剪、上下文路由和Token预算分配,旨在有效防止“上下文衰退”。它是构建复杂、长流程、多轮对话式AI系统的关键技术。
查看详情
代码模型评估与基准测试
evaluating-code-models
Orchestra-Research/AI-Research-SKILLs
200
本工具箱用于全面评估代码生成模型的性能。它支持针对HumanEval、MBPP、MultiPL-E等行业标准进行多语言基准测试。可量化比较不同大型语言模型(LLM)的编码能力,通过pass@k指标衡量代码生成质量。
查看详情
Exa搜索结果处理与RAG上下文管理
exa-data-handling
jeremylongshore/claude-code-plugins-plus-skills
186
用于处理和优化来自Exa搜索API的原始搜索结果。该技能提供对内容提取范围的全面控制,支持选择元数据、高亮、全文或结构化摘要。核心功能包括实现带时效性的结果缓存、引用去重,以及最关键的基于令牌预算的内容筛选,确保检索内容能适配大型语言模型(LLM)的上下文窗口,是构建高级RAG和知识检索系统的关键工具。
查看详情
大型语言模型(LLM)实现与训练
implementing-llms-litgpt
Orchestra-Research/AI-Research-SKILLs
252
LitGPT提供了一个用于实现和训练超过20种前沿大型语言模型(如Llama, Gemma, Mistral)的工具。它支持完整的微调(Fine-tuning)、高效的LoRA适配以及从零开始的预训练流程。适用于需要清晰模型结构、学术理解或生产级部署的开发者。
查看详情
知识蒸馏:大模型压缩
knowledge-distillation
Orchestra-Research/AI-Research-SKILLs
337
知识蒸馏(KD)是一种核心的AI模型压缩技术。它旨在将性能强大的大型语言模型(Teacher)的知识,高效地转移给更小、更易于部署的学生模型(Student)。这使得开发者能够在不损失关键性能的前提下,大幅降低推理成本,实现将前沿大模型能力落地到实际应用场景。
查看详情
LangChain LLM应用架构指南
langchain-architecture
sickn33/antigravity-awesome-skills
201
本指南深入讲解LangChain框架,帮助用户掌握构建复杂、生产级大型语言模型(LLM)应用程序的完整能力。内容涵盖自驱代理(Agents)、链式调用(Chains)、记忆管理、检索增强生成(RAG)以及外部工具集成等核心模块,全面助力构建智能AI系统。
查看详情
LangChain SDK安装与身份验证
langchain-install-auth
jeremylongshore/claude-code-plugins-plus-skills
493
本指南详细介绍了LangChain SDK在Python和Node.js环境中的安装流程。它指导用户配置核心依赖包,并安全地设置OpenAI、Anthropic和Google等主流大型语言模型(LLM)提供商的API密钥,是启动任何LLM应用开发项目的必备步骤。
查看详情
Langfuse CI/CD:LLM质量测试集成
langfuse-ci-integration
jeremylongshore/claude-code-plugins-plus-skills
444
本指南展示如何将Langfuse集成到CI/CD流水线(例如GitHub Actions)中,用于自动化大型语言模型(LLM)的质量测试。用户可以实现提示词回归测试、调用链验证和实验驱动的质量门禁,确保AI应用的稳定性和性能。
查看详情
Langfuse LLM 调用可观测性
langfuse-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
448
本工作流展示了如何使用 Langfuse 为大型语言模型(LLM)调用、链式调用和复杂 Agent 实现端到端的完整追踪。它覆盖了包括 OpenAI 包装器、RAG 流程的手动 Span 追踪、流式响应监控以及多模型(如 OpenAI, Anthropic)的集成。适用于需要深入了解 AI 系统性能、调试复杂流程和监控生产环境 LLM 使用情况的场景。
查看详情
1
2
3
4
下一页
语言
简体中文
English