下载

Skill UI

浏览并发现 6152+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索 Lua ，共找到 120 条记录

默认排序最新上传最多下载

机器学习模型评估

evaluating-machine-learning-models

jeremylongshore/claude-code-plugins-plus-skills

使用插件生成准确率、查准率、召回率、F1等指标，对机器学习模型性能进行全面评估，便于比较各模型并在上线前进行验证。

智能体评估框架

sickn33/antigravity-awesome-skills

构建符合多维指标的智能体评估体系，衡量令牌使用、工具调用和模型选择，验证上下文工程、捕捉回归并持续监控生产能力。

Excel贴现现金流模型

excel-dcf-modeler

jeremylongshore/claude-code-plugins-plus-skills

在Excel中构建专业DCF估值模型，涵盖假设输入、自由现金流预测、估值计算和敏感性分析，适用于投行与企业财务的估值场景。

财务分析工具包

financial-analyst

alirezarezvani/claude-skills

一套面向决策的财务分析工具，涵盖比率分析、DCF估值、预算差异拆解和滚动预测构建，支持财务建模、预测调整与管理报告。

LLM 微调专家指南

fine-tuning-expert

Jeffallan/claude-skills

面向大语言模型的实战微调流程，涵盖数据集准备、LoRA/QLoRA/PEFT 适配器配置、超参设置、训练监控、评估对比及量化部署等生产级步骤。

Granola成本调优攻略

granola-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

帮助团队评估Granola定价、对比套餐、监控使用量，并通过精选录制、存储整理、整合优化与议价策略降低成本，提升订阅价值。

反复检索模式

iterative-retrieval

affaan-m/everything-claude-code

在多代理工作流中通过迭代获取上下文：先广泛派发查询，再评估相关性，最后循环精炼标准（最多三圈），确保子代理收集到恰当的代码片段而不超出限制。

Langfuse评估与打分流程

langfuse-core-workflow-b

jeremylongshore/claude-code-plugins-plus-skills

使用Langfuse核心流程B收集用户反馈、自动化评估函数、LLM裁判评分，并对比提示以实现AI产出质量打分和AB测试。

LangSmith LLM 观测平台

langsmith-observability

Orchestra-Research/AI-Research-SKILLs

LangSmith 是用于调试、评估与监控 LLM 应用的观测平台，可追踪调用、构建评测数据集、监控生产指标与成本，助力回归测试与运维协作。

LLM评估工具集

sickn33/antigravity-awesome-skills

指导通过自动化指标、人工评估及大模型裁判策略，衡量提示、监控回归、验证生产部署质量。

欧盟MDR合规专家

mdr-745-specialist

alirezarezvani/claude-skills

提供欧盟MDR 2017/745在医疗器械分类、技术档案、临床证据与上市后监管上的全流程指导，涵盖附录规则、EUDAMED/UDI对接与通知机构配合。

模型评估指标助手

model-evaluation-metrics

jeremylongshore/claude-code-plugins-plus-skills

自动提供模型评估指标的指导，涵盖实践、代码和验证规范，针对提及模型评估指标时自动激活的训练辅助。

上一页 1 234 5 6...8 9 10 下一页

语言