登录
下载
Skill UI
浏览并发现
6004+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
ORM
,共找到
90
条记录
默认排序
最新上传
最多下载
OpenRouter 模型路由
openrouter-model-routing
jeremylongshore/claude-code-plugins-plus-skills
355
实现 OpenRouter 模型路由,支持 A/B 测试、渐进发布与性能驱动的模型选择,便于在多个环境中优化多模型部署与实验。
查看详情
Flash Attention优化
optimizing-attention-flash
Orchestra-Research/AI-Research-SKILLs
169
通过 Flash Attention 加速 Transformer 关注机制,可提供 2-4 倍速度提升和 10-20 倍内存节省,适用于 PyTorch 原生、flash-attn 库、H100 FP8 和滑动窗口等长上下文模型,解决显存瓶颈并提速推理。
查看详情
结构化文本生成
outlines
Orchestra-Research/AI-Research-SKILLs
137
Outlines 通过 CFG+FSM 策略配合 Pydantic 模型,确保 JSON/XML 等结构化输出合法,并兼容 Transformer、vLLM、llama.cpp 等本地模型,方便高性能推理。
查看详情
Perplexity 性能调优
perplexity-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
211
通过挑选合适模型、缓存查询哈希、为长研究启用流式输出以及对请求进行批处理和去重,提升 Perplexity Sonar API 在研究和事实核查类场景下的响应速度和成本效率。
查看详情
凤凰 AI 可观察平台
phoenix-observability
Orchestra-Research/AI-Research-SKILLs
434
Phoenix 是开源的 AI 可观测与评估平台,通过追踪、实验、数据集和实时面板帮助调试、评估和监控大模型应用,支持自托管部署。
查看详情
Qdrant 向量相似度搜索
qdrant-vector-search
Orchestra-Research/AI-Research-SKILLs
405
基于 Rust 的高性能向量相似度引擎,适用于生产级 RAG 与语义搜索场景,支持混合过滤、多向量存储、分布式扩容以及 REST/gRPC 接入,低延迟提供推荐和检索服务。
查看详情
LLM 量化工具包
quantizing-models-bitsandbytes
Orchestra-Research/AI-Research-SKILLs
243
将大模型量化至 8 位或 4 位,节省 50%~75% 显存,使受限 GPU 仍可执行推理与 QLoRA 微调,同时兼容 NF4/INT8、8 位优化器与 HuggingFace Transformers,保持高精度。
查看详情
Retell AI 性能调优指南
retellai-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
440
通过优化 LLM 提示、代理配置、WebSocket 连接池以及缓存与分析,提升 Retell AI 语音代理在高负载下的响应速度与稳定性。
查看详情
RWKV混合架构
rwkv-architecture
Orchestra-Research/AI-Research-SKILLs
497
RWKV混合架构将Transformer训练与RNN推理结合,提供线性时间、无限上下文的流式生成与长文处理,在内存有限的部署中无需KV缓存即可高效运行。
查看详情
高级计算机视觉工程指南
senior-computer-vision
alirezarezvani/claude-skills
175
面向生产的计算机视觉工程技能,涵盖目标检测、实例/语义分割、模型优化与推理部署,结合 YOLO/Faster R-CNN/DETR、Mask R-CNN/SAM、Transformer、PyTorch、ONNX/TensorRT 等框架,指导实战流程。
查看详情
句子变换器嵌入框架
sentence-transformers
Orchestra-Research/AI-Research-SKILLs
342
Sentence Transformers 提供 5000+ 预训练模型,支持多语言、多模态与领域定制嵌入,方便在 RAG、语义搜索、聚类和生产环境中本地生成高质量向量,无需调用外部 API。
查看详情
RadixAttention结构化服务
sglang
Orchestra-Research/AI-Research-SKILLs
326
高性能 LLM/VLM 服务框架,利用 RadixAttention 自动缓存前缀,加速结构化 JSON/正则输出、Agent 工作流与多轮工具调用生成。
查看详情
上一页
1
2
3
4
5
6
7
8
下一页
语言
简体中文
English