登录
下载
Skill UI
浏览并发现
9785+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
模型选择
,共找到
27
条记录
默认排序
最新上传
最多下载
RAG系统实现工作流
rag-implementation
sickn33/antigravity-awesome-skills
258
本工作流提供了一个从零到一的RAG(检索增强生成)系统构建指南。它涵盖了从嵌入模型选择、向量数据库配置、分块策略设计,到混合检索、LLM集成和系统评估的整个流程,确保构建出知识可靠、性能优越的AI应用。
查看详情
Vast.ai GPU成本优化指南
vastai-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
191
本工具包旨在帮助用户优化Vast.ai上的GPU云资源使用成本。它提供了选择成本效益最高GPU型号、利用抢占式(Spot)实例以及设置自动销毁机制的完整指南。通过检测闲置计算资源和监控运行费用,确保AI模型训练和推理作业能够高效、经济地完成。
查看详情
高级LLM评估技术
advanced-evaluation
sickn33/antigravity-awesome-skills
223
本技能专注于构建面向生产环境的LLM评估系统。内容涵盖了先进的评估方法论,包括直接评分和配对比较,并详细介绍了如何系统性地消除评估中的偏差(如位置偏差、长度偏差)。它指导用户如何选择合适的评估指标,并构建结构化的Prompt,以确保AI模型质量评估的客观性和可靠性。
查看详情
本地Hugging Face模型评估
hugging-face-community-evals
sickn33/antigravity-awesome-skills
359
本技能用于在本地硬件上对Hugging Face Hub上的大模型进行专业的评估和基准测试。它支持使用`inspect-ai`和`lighteval`等评估框架,帮助用户选择最佳推理后端(如`vllm`、Transformers或`accelerate`),进行全面的烟雾测试和任务选择。该技能专注于本地执行流程,不负责远程作业编排或结果发布。
查看详情
Transformers.js JavaScript 机器学习
transformers-js
sickn33/antigravity-awesome-skills
337
在浏览器或 Node.js 中通过 Transformers.js 运行 Hugging Face 模型,涵盖文本、图像与语音任务,提供 Pipeline 抽象、设备选择与量化选项,可在客户端部署多模态推理,无需后端。
查看详情
Anthropic Claude成本优化指南
anth-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
393
本指南提供了优化Anthropic Claude API使用成本的全面策略。涵盖了模型路由(根据任务选择最经济的模型)、提示词缓存(减少重复输入成本)、批量处理(处理异步任务)以及实时支出跟踪与预算预警。适用于需要管理大规模、高成本AI应用部署和精确预算控制的场景。
查看详情
Anthropic API成本优化指南
clade-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
227
本指南详细介绍了在使用Anthropic Claude API时降低成本的专业策略。内容涵盖了根据任务复杂度选择合适的模型(Haiku, Sonnet, Opus)、实施提示词缓存、利用消息批量处理,以及高效的令牌数量削减技巧,帮助开发者构建成本效益更高的AI应用。
查看详情
ElevenLabs TTS性能优化指南
elevenlabs-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
469
本指南提供了优化ElevenLabs TTS性能的完整技术方案。内容涵盖了如何通过模型选择(如Flash模型)、利用流媒体(Streaming)接口以及优化音频格式,来显著降低语音生成延迟和提高数据吞吐量。适用于实时对话、IVR系统和高并发的语音内容生成场景。
查看详情
AssemblyAI转录性能优化指南
assemblyai-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
62
本指南提供了优化AssemblyAI转录性能的全面高级策略。涵盖了如何最大化处理吞吐量和最小化延迟,指导用户实现缓存机制、使用Webhook替代轮询、根据需求选择最佳模型,以及高效并行处理大规模批次任务。
查看详情
Cohere API性能调优指南
cohere-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
466
本指南提供全面的Cohere API v2性能优化策略。旨在帮助用户优化Chat、Embed和Rerank等核心API的使用效率,显著提高API吞吐量、降低延迟和管理成本。核心技术包括根据延迟预算选择最佳模型、实现流式传输(Streaming)以提升用户体验、高效批量嵌入(Batching)处理、向量压缩以及部署缓存机制。
查看详情
ElevenLabs成本优化与配额监控
elevenlabs-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
446
本技能旨在帮助用户优化 ElevenLabs 语音合成(TTS)的运行成本。它提供了一套完整的流程,包括基于成本的模型选择、通过优化文本内容来减少计费字符数,以及实现实时的配额使用监控和预算预警。适用于构建高并发、对成本敏感的语音应用。
查看详情
ElevenLabs语音合成API指南
elevenlabs-hello-world
jeremylongshore/claude-code-plugins-plus-skills
224
本技能提供了一份完整的ElevenLabs语音合成API使用指南。内容涵盖使用TypeScript、Python和cURL等多种方式,实现文本到语音的高质量转换。用户可以学习如何精细控制语音参数、选择不同模型(如低延迟流式传输),适用于各类需要高质量语音内容生成的应用开发。
查看详情
上一页
1
2
3
下一页
语言
简体中文
English