下载

Skill UI

浏览并发现 9688+ 精选技能

全部编程开发人工智能设计创意产品商业数据科学市场营销职场通用效率工具硬件工程语言学习

搜索 ZAT ，共找到 107 条记录

默认排序最新上传最多下载

半二次量化方案

hqq-quantization

Orchestra-Research/AI-Research-SKILLs

提供无需校准数据即可将大模型权重量化至1位的流程，兼容 vLLM 与 HuggingFace，支持多种后端和 LoRA/PEFT 微调，适合快速部署与实验极限量化。

HuggingFace 高速分词器

huggingface-tokenizers

Orchestra-Research/AI-Research-SKILLs

以 Rust 性能和 Python 易用性为基础的高速分词工具，支持 BPE/WordPiece/Unigram 算法、自定义词表训练、位置对齐、批量填充，适用于生产级 NLP 流水线。

推理延迟分析器

inference-latency-profiler

jeremylongshore/claude-code-plugins-plus-skills

本技能自动处理推理延迟分析器相关任务，在 ML 部署场景中提供模型服务、MLOps 管道、监控和生产优化等按步骤指导，生成生产级代码并校验输出标准，助力快速完成推理性能调优。

Kling AI 定价与成本优化

klingai-pricing-basics

jeremylongshore/claude-code-plugins-plus-skills

本技能详细解析Kling AI的计费体系，提供全面的基于信用点的定价指南。它涵盖了视频生成、图像创建和API资源包的成本结构。用户可以利用本工具准确估算项目预算，制定成本优化策略，确保高效、经济地完成AI内容生成工作流。

LangChain生产环境就绪度清单

langchain-prod-checklist

jeremylongshore/claude-code-plugins-plus-skills

这是一份全面的LangChain应用程序生产环境就绪度清单。它系统性地覆盖了从配置管理、错误处理、可观测性（如LangSmith）、性能优化、安全加固（防止提示注入、处理PII）到严格测试和部署策略等多个维度，帮助开发者确保AI应用具备高可靠性和可维护性，适用于应用上线前或现有系统的审计。

Langfuse LLM成本监控与优化

langfuse-cost-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南展示如何利用Langfuse强大的分析功能，实现大型语言模型（LLM）的成本监控、分析与优化。内容涵盖自动令牌使用量跟踪、通过Metrics API获取成本报告，以及实现智能模型路由，根据任务复杂度和输入长度自动选择最具成本效益的模型。适用于需要管理AI预算、控制LLM支出和提升系统效率的开发团队。

CPU/边缘本地大模型推理

Orchestra-Research/AI-Research-SKILLs

llama.cpp是一个纯C/C++编写的轻量级推理框架，专为在资源受限的设备上运行大型语言模型（LLM）而设计。它特别适用于没有高性能NVIDIA GPU（CUDA）的场景，非常适合Apple Silicon、AMD/Intel GPU以及边缘计算设备。通过支持GGUF量化，可以实现内存占用和推理速度的显著优化，支持本地跨平台部署。

大型语言模型提示词优化

llm-application-dev-prompt-optimize

sickn33/antigravity-awesome-skills

本技能模拟专家级提示词工程师，专注于为大型语言模型（LLMs）优化提示词。它运用宪法AI、思维链等高级技术，将基础指令转化为生产级的优化提示，能够显著提高模型的准确性、降低幻觉并节省成本。适用于需要系统性提升LLM性能和流程优化的场景。

多智能体MLOps管道编排

machine-learning-ops-ml-pipeline

sickn33/antigravity-awesome-skills

本技能旨在指导设计和实现一个完整的、生产级别的机器学习（ML）管道。它采用多智能体编排工作流，系统地覆盖了ML整个生命周期：包括数据摄取、特征工程、模型训练、代码优化和生产部署（MLOps），确保系统具备高可重复性、可监控性和高扩展性。

Mistral AI API性能调优指南

mistral-performance-tuning

jeremylongshore/claude-code-plugins-plus-skills

本指南提供一套全面的Mistral AI API性能优化框架。内容涵盖模型选型、响应流式传输（Streaming）、请求缓存、并发控制到提示词优化等高级技术。帮助开发者解决API响应慢、吞吐量不足等问题，实现高效、低延迟、高稳定性的AI应用集成，是构建生产级AI系统的必备知识。

模型量化部署助手

model-quantization-tool

jeremylongshore/claude-code-plugins-plus-skills

自动化提供模型量化部署的指导，涵盖工具使用、最佳实践以及面向推理、MLops 与监控的生产准备流程。

模型注册管理器

model-registry-manager

jeremylongshore/claude-code-plugins-plus-skills

在机器学习部署中自动响应与模型注册管理相关的请求，帮助搭建模型服务、MLOps 流水线、监控与生产优化。

上一页 1 234 5 6 7 8 9 下一页

语言