
LLM量化与压缩:理论基础(无需编程),掌握大型语言模型 (LLM) 量化和压缩的理论基础,了解如何优化最先进的 AI 模型以实现高效部署——无需编写任何代码。现代大型语言模型包含数十亿个参数,因此训练和部署的计算成本非常高昂。构建可用于生产环境的人工智能系统需要的远不止编程技能;它还需要对模型优化、数学原理、硬件限制、压缩技术和架构权衡有深刻的理解。
本课程旨在从基本原理出发,构建这些概念基础。课程重点不在于实现细节或编码语法,而是培养理解LLM如何在云端、边缘和移动环境中高效压缩、加速和部署所需的思维模型。
完成本课程后,您将了解:
- 模型压缩的数学基础
- 训练后量化(PTQ)
- 量化感知训练(QAT)
- 激活感知权重量化(AWQ)
- GPTQ 和高级量化技术
- 低秩自适应(LoRA)
- QLoRA 和参数高效的微调
- 结构化和非结构化剪枝方法
- 知识提炼
- 混合精度推理
- 硬件感知优化
- 性能、延迟、内存和可扩展性之间的权衡
- 部署策略和生产最佳实践
本课程非常适合:
- 人工智能工程师和机器学习工程师
- LLM工程师
- 人工智能平台架构师
- 系统工程师
- 基础设施和MLOps工程师
- 硬件-软件协同设计工程师
- 技术主管和工程经理
- 研究人员和研究生
- 任何想了解LLM优化而无需编程的人
格 式:MP4
分 辨 率:高清1280×720
语言字幕:英语,AI精翻中文字幕
大 小:3.03 GB
版权声明:资源来源于互联网收集整理,仅供学习交流,如果喜欢请支持正版。
本站仅作为资源信息收集站点,无法保证资源的可用及完整性,不提供任何资源安装使用及技术服务。请自己研究文档
