登录
下载
Skill UI
浏览并发现
6170+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
Transformers
,共找到
11
条记录
默认排序
最新上传
最多下载
GPTQ 大模型量化
gptq
Orchestra-Research/AI-Research-SKILLs
64
通过 GPTQ 的组束量化将大模型压缩到 4bit,在 RTX 4090/3090 等消费级 GPU 上实现 4 倍内存缩减、快速推理和 PEFT+QLoRA 兼容,便于部署与微调。
查看详情
快速NLP分词器
huggingface-tokenizers
Orchestra-Research/AI-Research-SKILLs
369
HuggingFace Tokenizers 以 Rust 性能提供高速分词,可训练多种算法,支持对齐、填充及与 transformers 的无缝集成,适配大规模生产环境。
查看详情
Mamba 选择性状态空间模型
mamba-architecture
Orchestra-Research/AI-Research-SKILLs
490
Mamba 提供选择性状态空间模型,线性复杂度与无 KV 缓存让百万级长序列推理更快更省内存,适用于长上下文语言建模、流式生成和硬件友好部署场景。
查看详情
临床 AI SDK 模式集
openevidence-sdk-patterns
jeremylongshore/claude-code-plugins-plus-skills
418
指导如何使用 OpenEvidence SDK 构建临床 AI 决策支持,包括单例客户端、类型化查询构建器、响应转换器与缓存策略,确保可靠的证据分级与性能表现。
查看详情
结构化文本生成
outlines
Orchestra-Research/AI-Research-SKILLs
136
Outlines 通过 CFG+FSM 策略配合 Pydantic 模型,确保 JSON/XML 等结构化输出合法,并兼容 Transformer、vLLM、llama.cpp 等本地模型,方便高性能推理。
查看详情
LLM 量化工具包
quantizing-models-bitsandbytes
Orchestra-Research/AI-Research-SKILLs
333
将大模型量化至 8 位或 4 位,节省 50%~75% 显存,使受限 GPU 仍可执行推理与 QLoRA 微调,同时兼容 NF4/INT8、8 位优化器与 HuggingFace Transformers,保持高精度。
查看详情
高级计算机视觉工程指南
senior-computer-vision
alirezarezvani/claude-skills
309
面向生产的计算机视觉工程技能,涵盖目标检测、实例/语义分割、模型优化与推理部署,结合 YOLO/Faster R-CNN/DETR、Mask R-CNN/SAM、Transformer、PyTorch、ONNX/TensorRT 等框架,指导实战流程。
查看详情
句子变换器嵌入框架
sentence-transformers
Orchestra-Research/AI-Research-SKILLs
318
Sentence Transformers 提供 5000+ 预训练模型,支持多语言、多模态与领域定制嵌入,方便在 RAG、语义搜索、聚类和生产环境中本地生成高质量向量,无需调用外部 API。
查看详情
Hugging Face 变压器模型
transformers
K-Dense-AI/claude-scientific-skills
322
使用 Hugging Face Transformers 库加载预训练模型,快速执行文本、图像、音频及多模态推理,控制模型初始化与设备,处理标记化并在定制数据上微调训练。
查看详情
本地 Hugging Face 评估
hugging-face-community-evals
sickn33/antigravity-awesome-skills
223
在本地使用 inspect-ai 或 lighteval 对 Hugging Face Hub 模型做评估,可选 vllm、Transformers、accelerate 等推理后端,并以 smoke test 和后端回退策略安全扩容,如需远程则交给 hugging-face-jobs。
查看详情
浏览器与 Node.js 模型运行
transformers-js
sickn33/antigravity-awesome-skills
91
使用 Transformers.js 在浏览器或 Node.js 中直接运行 Hugging Face 模型,覆盖文本、图像、语音等多模态任务,并可通过 WebGPU 与量化配置优化前端推理体验。
查看详情
1
语言
简体中文
English