登录
下载
Skill UI
浏览并发现
6152+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
Lua
,共找到
120
条记录
默认排序
最新上传
最多下载
机器学习模型评估
evaluating-machine-learning-models
jeremylongshore/claude-code-plugins-plus-skills
338
使用插件生成准确率、查准率、召回率、F1等指标,对机器学习模型性能进行全面评估,便于比较各模型并在上线前进行验证。
查看详情
智能体评估框架
evaluation
sickn33/antigravity-awesome-skills
373
构建符合多维指标的智能体评估体系,衡量令牌使用、工具调用和模型选择,验证上下文工程、捕捉回归并持续监控生产能力。
查看详情
Excel贴现现金流模型
excel-dcf-modeler
jeremylongshore/claude-code-plugins-plus-skills
415
在Excel中构建专业DCF估值模型,涵盖假设输入、自由现金流预测、估值计算和敏感性分析,适用于投行与企业财务的估值场景。
查看详情
财务分析工具包
financial-analyst
alirezarezvani/claude-skills
140
一套面向决策的财务分析工具,涵盖比率分析、DCF估值、预算差异拆解和滚动预测构建,支持财务建模、预测调整与管理报告。
查看详情
LLM 微调专家指南
fine-tuning-expert
Jeffallan/claude-skills
405
面向大语言模型的实战微调流程,涵盖数据集准备、LoRA/QLoRA/PEFT 适配器配置、超参设置、训练监控、评估对比及量化部署等生产级步骤。
查看详情
Granola成本调优攻略
granola-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
490
帮助团队评估Granola定价、对比套餐、监控使用量,并通过精选录制、存储整理、整合优化与议价策略降低成本,提升订阅价值。
查看详情
反复检索模式
iterative-retrieval
affaan-m/everything-claude-code
329
在多代理工作流中通过迭代获取上下文:先广泛派发查询,再评估相关性,最后循环精炼标准(最多三圈),确保子代理收集到恰当的代码片段而不超出限制。
查看详情
Langfuse评估与打分流程
langfuse-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
400
使用Langfuse核心流程B收集用户反馈、自动化评估函数、LLM裁判评分,并对比提示以实现AI产出质量打分和AB测试。
查看详情
LangSmith LLM 观测平台
langsmith-observability
Orchestra-Research/AI-Research-SKILLs
229
LangSmith 是用于调试、评估与监控 LLM 应用的观测平台,可追踪调用、构建评测数据集、监控生产指标与成本,助力回归测试与运维协作。
查看详情
LLM评估工具集
llm-evaluation
sickn33/antigravity-awesome-skills
205
指导通过自动化指标、人工评估及大模型裁判策略,衡量提示、监控回归、验证生产部署质量。
查看详情
欧盟MDR合规专家
mdr-745-specialist
alirezarezvani/claude-skills
490
提供欧盟MDR 2017/745在医疗器械分类、技术档案、临床证据与上市后监管上的全流程指导,涵盖附录规则、EUDAMED/UDI对接与通知机构配合。
查看详情
模型评估指标助手
model-evaluation-metrics
jeremylongshore/claude-code-plugins-plus-skills
227
自动提供模型评估指标的指导,涵盖实践、代码和验证规范,针对提及模型评估指标时自动激活的训练辅助。
查看详情
上一页
1
2
3
4
5
6
...
8
9
10
下一页
语言
简体中文
English