登录
下载
Skill UI
浏览并发现
9765+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
框架
,共找到
58
条记录
默认排序
最新上传
最多下载
大语言模型智能体评估
agent-evaluation
sickn33/antigravity-awesome-skills
271
这是一个用于全面测试和评估大型语言模型(LLM)智能体的框架。它超越了简单的通过/失败判断,深入评估智能体的复杂行为、可靠性指标和能力一致性。适用于生产环境的监控,帮助识别高级AI智能体中的微妙故障模式。
查看详情
智能体性能优化工作流
agent-orchestration-improve-agent
sickn33/antigravity-awesome-skills
398
本工作流提供了一个系统性的框架,用于提升现有AI智能体的性能和可靠性。流程包括全面性能指标分析、详细的故障模式分类、高级提示词工程优化(如思维链和宪法AI),并最终通过结构化的A/B测试和受控部署,实现可量化、鲁棒的性能提升。
查看详情
多智能体系统优化工具
agent-orchestration-multi-agent-optimize
sickn33/antigravity-awesome-skills
165
这是一个先进的人工智能驱动框架,用于进行多智能体系统的整体性能工程优化。它提供协调的性能分析、工作负载分配和成本感知编排,覆盖数据库、应用层和前端等多个领域。可用于识别系统瓶颈,提高吞吐量,增强复杂智能体工作流的可靠性和效率。
查看详情
自适应AI操作模式
behavioral-modes
sickn33/antigravity-awesome-skills
262
本技能提供了一套结构化的行为框架,定义了多个AI运行模式(如头脑风暴、实现、调试、审查、教学和部署)。它能够根据用户任务所处的阶段,自动调整AI的思维方式和输出格式,从而确保无论是在概念发散、代码编写还是最终发布,都能获得系统化、高质量的输出。
查看详情
BLIP-2 视觉语言框架
blip-2-vision-language
Orchestra-Research/AI-Research-SKILLs
239
该框架将冻结的图像编码器与大语言模型连接,适用于图像描述、视觉问答、检索与多模态对话,在无需微调的条件下实现零样本推理,并仅训练轻量 Q-Former。
查看详情
研究点子头脑风暴工具
brainstorming-research-ideas
Orchestra-Research/AI-Research-SKILLs
218
通过十套结构化的创意框架引导研究者,从模糊好奇到具体可行的研究建议,适用于探索新问题、项目转型或寻找高价值切入点。
查看详情
上下文优化策略
context-optimization
sickn33/antigravity-awesome-skills
293
本技能提供了一套高级的LLM上下文管理框架,旨在提升有限上下文窗口的有效容量。它涵盖了压缩、观测屏蔽、KV缓存优化和上下文分区等四种核心技术。通过优化Token使用,可以有效解决上下文限制问题,帮助构建成本更低、延迟更小、能处理大规模文档和复杂任务的生产级AI Agent系统。
查看详情
Claude 评估驱动框架
eval-harness
affaan-m/everything-claude-code
90
Claude Code正式评估框架,先定义能力与回归标准,再用代码/模型/人工评估多个阶段,并持续跟踪pass@k和pass^k等可靠性指标以确保交付质量。
查看详情
LLM 评估框架
evaluating-llms-harness
Orchestra-Research/AI-Research-SKILLs
484
提供涵盖 MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag 等 60+ 学术基准测试的标准化评估流程,可用来对 HuggingFace、vLLM 或 API 模型打分、比对性能、跟踪训练进度。
查看详情
智能体系统评估框架
evaluation
sickn33/antigravity-awesome-skills
70
该技能用于构建复杂的智能体系统评估框架。它解决了智能体系统非确定性和多路径决策的难题,指导用户进行系统性性能测试,用于验证上下文工程的选择,并衡量跨多个质量维度(如事实准确性、工具效率)的持续改进。
查看详情
梯度裁剪助手
gradient-clipping-helper
jeremylongshore/claude-code-plugins-plus-skills
417
梯度裁剪助手针对机器学习训练流程提供自动化支持,指导梯度裁剪模式、生成可部署代码与配置,并校验 PyTorch、TensorFlow 等框架下的结果。
查看详情
LangChain LLM应用架构指南
langchain-architecture
sickn33/antigravity-awesome-skills
201
本指南深入讲解LangChain框架,帮助用户掌握构建复杂、生产级大型语言模型(LLM)应用程序的完整能力。内容涵盖自驱代理(Agents)、链式调用(Chains)、记忆管理、检索增强生成(RAG)以及外部工具集成等核心模块,全面助力构建智能AI系统。
查看详情
1
2
3
4
5
下一页
语言
简体中文
English