登录
下载
Skill UI
浏览并发现
9101+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
vast.ai
,共找到
26
条记录
默认排序
最新上传
最多下载
GPU工作负载迁移:Vast.ai实战指南
vastai-migration-deep-dive
jeremylongshore/claude-code-plugins-plus-skills
124
本指南详细介绍了GPU工作负载的迁移流程,指导用户如何将深度学习训练环境从AWS、GCP等主流云平台或其它GPU云迁移到Vast.ai。内容涵盖成本对比分析、Docker镜像适配、云凭证处理以及完整的验证和回滚步骤,是进行复杂计算资源迁移的实战手册。
查看详情
多环境云资源部署配置
vastai-multi-env-setup
jeremylongshore/claude-code-plugins-plus-skills
223
本指南详细介绍了如何在Vast.ai云平台上实现开发、预发布和生产环境的隔离配置。它通过使用环境变量和配置类,强制执行独立的API密钥、预算上限、实例限制和GPU白名单,从而确保资源高效管理和成本控制。
查看详情
Vast.ai GPU监控与成本追踪
vastai-observability
jeremylongshore/claude-code-plugins-plus-skills
241
本技能提供Vast.ai GPU实例的全面监控方案,可采集GPU利用率、实例运行状态、温度和成本累积等关键指标。适用于搭建监控仪表板、配置告警机制(如GPU空闲、过热、预算超支)以及自动化云资源使用跟踪,确保资源健康和成本可控。
查看详情
AI深度学习GPU性能优化
vastai-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
77
这是一份关于深度学习工作流和云GPU平台性能优化的综合指南。内容涵盖了如何通过性能/金钱比选择最佳实例、减少启动延迟、精细调优数据管道(如DataLoader和pin_memory),以及使用PyTorch和Bash脚本实现多GPU分布式训练,以最大化计算资源的利用率和训练效率。
查看详情
Vast.ai GPU生产级部署检查表
vastai-prod-checklist
jeremylongshore/claude-code-plugins-plus-skills
307
这份清单旨在指导用户在Vast.ai上部署大规模、生产级的GPU工作负载。它系统性地覆盖了从账户认证、实例选型、数据加密、检查点管理、到处理竞价实例中断、成本控制及性能监控等所有关键步骤,确保深度学习任务的稳定可靠运行。
查看详情
处理API速率限制与退避机制
vastai-rate-limits
jeremylongshore/claude-code-plugins-plus-skills
94
本技能集提供了处理API速率限制(HTTP 429错误)的完整解决方案。内容包括使用Python实现的自动重试逻辑、指数退避算法,以及针对批量查询和状态轮询的最佳实践,确保您的API交互过程稳定、高效。
查看详情
Vast.ai GPU计算工作流架构
vastai-reference-architecture
jeremylongshore/claude-code-plugins-plus-skills
482
本指南提供了在Vast.ai上运行复杂GPU计算工作流的生产级参考架构。它详细介绍了三层架构模式(编排器、GPU工作节点、存储),指导用户设计故障容错的ML/AI训练管线、作业队列和持久化检查点管理,确保系统的高可靠性与可扩展性。
查看详情
Vast.ai 云开发模式
vastai-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
465
这套技能集提供了与 Vast.ai 云平台 API 交互的生产级 Python 代码模式。涵盖了带类型定义的搜索查询构建、上下文管理的实例生命周期控制(自动清理)、资源评分算法、带指数退避的重试机制以及安全的远程 SSH 执行。适用于构建可靠、复杂的云工作流应用。
查看详情
Vast.ai 安全基础与最佳实践
vastai-security-basics
jeremylongshore/claude-code-plugins-plus-skills
489
本技能提供了使用Vast.ai云环境时的安全最佳实践指南。内容涵盖API密钥管理、强化SSH访问安全、数据销毁前的安全清理,以及网络传输规范。适用于构建和维护安全、可靠的AI开发和模型训练环境。
查看详情
Vast.ai CLI升级与API迁移指南
vastai-upgrade-migration
jeremylongshore/claude-code-plugins-plus-skills
179
本技能指南提供了完整的Vast.ai命令行工具和Python SDK升级流程。它涵盖了API版本迁移、检测兼容性变更(breaking changes)以及更新Docker镜像和CUDA版本的步骤,确保用户在云GPU计算资源环境中的持续工作兼容性。
查看详情
GPU事件驱动工作流构建
vastai-webhooks-events
jeremylongshore/claude-code-plugins-plus-skills
310
本技能旨在构建基于事件驱动的GPU资源管理工作流,用于Vast.ai平台。由于平台缺乏原生Webhook,本方案利用Python进行定时轮询,持续监控GPU实例的状态变化(如加载、运行、退出)。这支持实现复杂的自动化任务,包括在抢占式预留时自动恢复、处理实例生命周期事件以及进行成本跟踪。
查看详情
监控实验结果
monitor-experiment
wanshuiyin/Auto-claude-code-research-in-sleep
123
通过查看远程 screen 会话、收集日志、解析 JSON 输出,并可选地从 WandB 获取指标,汇总基线、变化和成本信息,以便对 Vast.ai 或 Modal 训练进行全过程监控。
查看详情
上一页
1
2
3
下一页
语言
简体中文
English