登录
下载
Skill UI
浏览并发现
9183+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
分布式计算
,共找到
3
条记录
默认排序
最新上传
最多下载
AI深度学习GPU性能优化
vastai-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
77
这是一份关于深度学习工作流和云GPU平台性能优化的综合指南。内容涵盖了如何通过性能/金钱比选择最佳实例、减少启动延迟、精细调优数据管道(如DataLoader和pin_memory),以及使用PyTorch和Bash脚本实现多GPU分布式训练,以最大化计算资源的利用率和训练效率。
查看详情
CoreWeave分布式GPU训练工作流
coreweave-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
142
本指南详细介绍了如何在CoreWeave平台上运行大规模的分布式GPU训练任务。它涵盖了单节点多GPU配置和多节点训练,支持PyTorch DDP,是进行大型语言模型(LLM)微调或需要高性能计算集群的深度学习模型训练的推荐工作流。
查看详情
启智平台计算任务管理CLI
qzcli
wanshuiyin/Auto-claude-code-research-in-sleep
342
qzcli是一个为启智(Qizhi)平台设计的命令行工具,用于管理和调度GPU计算资源任务。它模拟kubectl的交互式使用体验,支持用户登录、查询可用节点、提交交互式或复杂的批量训练任务(包括矩阵参数扫描)。适用于高性能计算(HPC)和分布式机器学习训练流程。
查看详情
1
语言
简体中文
English