登录
下载
Skill UI
浏览并发现
5096+
精选技能
全部
编程开发
人工智能
设计创意
产品商业
数据科学
市场营销
职场通用
效率工具
硬件工程
语言学习
搜索
LLM优化
,共找到
17
条记录
默认排序
最新上传
最多下载
LangChain 成本调优
langchain-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
422
针对 LangChain 生产应用,提供令牌统计、提示裁剪、模型分层、缓存和预算控制的实践方法,帮助监控成本、优化令牌消耗并防止超支。
查看详情
Langfuse 成本优化指南
langfuse-cost-tuning
jeremylongshore/claude-code-plugins-plus-skills
357
利用 Langfuse 观测数据跟踪每次生成的令牌消耗,汇总模型与时间维度的成本,设置预算告警,并通过模型路由、缓存与提示优化降低整体 AI 开支。
查看详情
大模型提示优化
llm-application-dev-prompt-optimize
sickn33/antigravity-awesome-skills
108
面向提示工程专家,提供宪法式 AI、链式思维、模型定制等高级提示优化方法,提升准确率、降低幻觉并节约令牌成本,助力生成生产级提示。
查看详情
LLM 集成模式指南
llm-integration
rohitg00/awesome-claude-code-toolkit
97
实践指南涵盖 API 客户端、流式响应、函数调用、RAG 管道、文档切片与成本优化等 Claude LLM 集成策略,附反模式警示。
查看详情
LLM模型剪枝优化
model-pruning
Orchestra-Research/AI-Research-SKILLs
104
使用Wanda、SparseGPT和结构/非结构/N:M稀疏剪枝,在不重训情况下将LLM压缩约50%,适配加速卡或边缘设备,减少内存与延迟。
查看详情
LLM提示优化
optimizing-prompts
jeremylongshore/claude-code-plugins-plus-skills
99
分析并简化提示词,减少冗余、压缩字数、提升指令明确性,让使用大模型时成本更低、响应更快、输出更清晰,适合希望优化提示以控制费用或提升效果的场景。
查看详情
高级提示工程实践
prompt-engineer
Jeffallan/claude-skills
313
引导团队设计、优化与评估大模型提示,涵盖结构化输出、系统角色与防护、思维链等技巧,并通过测试与性能度量保证可靠性。
查看详情
LLM 量化工具包
quantizing-models-bitsandbytes
Orchestra-Research/AI-Research-SKILLs
243
将大模型量化至 8 位或 4 位,节省 50%~75% 显存,使受限 GPU 仍可执行推理与 QLoRA 微调,同时兼容 NF4/INT8、8 位优化器与 HuggingFace Transformers,保持高精度。
查看详情
Retell AI 性能调优指南
retellai-performance-tuning
jeremylongshore/claude-code-plugins-plus-skills
440
通过优化 LLM 提示、代理配置、WebSocket 连接池以及缓存与分析,提升 Retell AI 语音代理在高负载下的响应速度与稳定性。
查看详情
高级提示工程工具
senior-prompt-engineer
alirezarezvani/claude-skills
364
Senior Prompt Engineer 汇聚提示优化、RAG 评估与智能体编排功能,帮助团队分析令牌、构建少样本示例并校验结构化流程以驱动大模型应用。
查看详情
简易偏好优化训练
simpo-training
Orchestra-Research/AI-Research-SKILLs
477
SimPO 提供一种无需参考模型的偏好优化方案,能够在单节点、有限算力下更快、更简单地对齐大模型,相比 DPO/PPO 性能更好,适合希望快速训练的偏好对齐场景。
查看详情
Slime 强化学习训练框架
slime-rl-training
Orchestra-Research/AI-Research-SKILLs
214
使用 Slime(Megatron+SGLang)框架提供 LLM 强化学习后训练指引,涵盖 GLM、Qwen、Llama 等模型的数据缓冲、Rollout 管理与 Megatron-LM 集成,便于扩展式策略优化。
查看详情
1
2
下一页
语言
简体中文
English