登录
下载
Skill UI
浏览并发现
9778+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
规模
,共找到
31
条记录
默认排序
最新上传
最多下载
数据管道策略护栏
clay-policy-guardrails
jeremylongshore/claude-code-plugins-plus-skills
309
该系统为数据富集管道提供全面的策略护栏。它强制执行信用额度限制,阻止敏感个人身份信息(PII)的富集,并对输入数据进行严格的验证。适用于处理大规模、高敏感度数据的场景,确保数据安全性和合规性。
查看详情
网页爬取与内容抓取工作流
firecrawl-core-workflow-a
jeremylongshore/claude-code-plugins-plus-skills
50
本工作流提供核心机制,用于将复杂的实时网站内容转换为干净、结构化的、适用于大型语言模型(LLM)的Markdown格式。它支持单页抓取、深度站点爬取以及大规模异步内容爬取,是构建健壮内容摄取管道的理想方案,能够可靠地从网页中提取结构化信息。
查看详情
进阶候选人数据分析工作流
juicebox-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
475
本工作流用于对大规模人才智能数据集进行深度分析。用户可以构建具备多维度筛选条件的自定义查询,执行跨数据集比较(如不同时间段的候选人池对比),并按地域聚合技能密度。这对于需要识别市场趋势和优化招聘策略的招聘团队至关重要。
查看详情
GPU驱动数据策划
nemo-curator
Orchestra-Research/AI-Research-SKILLs
226
NeMo Curator 依托 GPU 与 RAPIDS,为文本/图像/视频/音频等多模态提供质量筛选、模糊与语义去重、PII/NSFW 处理等步骤,快速清洗大规模训练数据。
查看详情
Ray数据处理平台
ray-data
Orchestra-Research/AI-Research-SKILLs
76
Ray Data 提供可扩展的分布式数据处理,支持 CPU/GPU 流式执行,兼容 Parquet、CSV、JSON、图像等多模态,集成 PyTorch、TensorFlow、Ray Train,适合批量推理、ETL 与大规模预处理。
查看详情
Ray Train 分布式协调
ray-train
Orchestra-Research/AI-Research-SKILLs
64
Ray Train 统一协调 PyTorch、TensorFlow 与 HuggingFace 的分布式训练,从单机扩展到多节点集群,自动处理显卡分配、容错、断点恢复与超参搜索,帮助团队在无需大量改动的前提下完成大规模模型训练。
查看详情
Apache Spark性能优化与调优
spark-optimization
sickn33/antigravity-awesome-skills
81
详细介绍了Apache Spark作业的生产级优化模式和最佳实践。内容涵盖分区策略、内存管理、数据倾斜处理、连接优化(如广播连接和桶连接)以及资源调优,帮助用户解决大规模数据处理中的性能瓶颈,提升数据管道的运行效率。
查看详情
Vast.ai分布式训练与成本管理
vastai-core-workflow-b
jeremylongshore/claude-code-plugins-plus-skills
439
这是一个高级工作流,用于在Vast.ai上编排复杂的、多节点的GPU集群。它专为大规模分布式机器学习训练设计,能自动处理Spot机中断和使用检查点进行作业恢复。同时,该工作流提供全面的成本分析功能,帮助用户跟踪账单历史,优化GPU支出,并安全地销毁集群以停止计费。
查看详情
CELLxGENE普查查询助手
cellxgene-census
K-Dense-AI/claude-scientific-skills
274
通过程序化接口访问CZ CELLxGENE 61M+细胞数据,按组织、疾病及细胞类型查询表达、元数据、嵌入与统计,便于与scanpy或模型流程结合开展大规模分析。
查看详情
OFR对冲基金监控
hedgefundmonitor
K-Dense-AI/claude-scientific-skills
106
无需密钥即可调用OFR对冲基金开放接口,获取规模、杠杆、对手方、流动性与风险管理等系列时间数据,适合系统性风险监测与金融研究。
查看详情
Vaex 大规模数据处理
vaex
K-Dense-AI/claude-scientific-skills
397
Vaex 是一款高性能 Python 库,利用延迟计算和磁盘外表格,能在内存不足时处理数十亿行数据,适合做大数据统计、可视化、格式转换及机器学习流程。
查看详情
用Arboreto推断基因调控网络
arboreto
K-Dense-AI/scientific-agent-skills
419
Arboreto是一个强大的Python库,用于从各种基因表达数据集(包括bulk和scRNA-seq)推断基因调控网络(GRNs)。它利用GRNBoost2和GENIE3等高级机器学习算法,支持Dask的分布式计算,适用于分析大规模的转录组学数据。它可以帮助用户识别关键的转录因子-靶基因调控关系。
查看详情
1
2
3
下一页
语言
简体中文
English