登录
下载
Skill UI
浏览并发现
7129+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
QA
,共找到
3
条记录
默认排序
最新上传
最多下载
BLIP-2 视觉语言框架
blip-2-vision-language
Orchestra-Research/AI-Research-SKILLs
118
该框架将冻结的图像编码器与大语言模型连接,适用于图像描述、视觉问答、检索与多模态对话,在无需微调的条件下实现零样本推理,并仅训练轻量 Q-Former。
查看详情
LLM 评估框架
evaluating-llms-harness
Orchestra-Research/AI-Research-SKILLs
157
提供涵盖 MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag 等 60+ 学术基准测试的标准化评估流程,可用来对 HuggingFace、vLLM 或 API 模型打分、比对性能、跟踪训练进度。
查看详情
Python LLM 评估驱动QA
eval-driven-dev
github/awesome-copilot
84
为 Python LLM 应用搭建评估驱动的 QA 流程,记录真实执行、注入测试输入、用评估器打分 pixie test 结果,并基于反馈修复问题,确保质量。
查看详情
1
语言
简体中文
English