大语言模型量化与压缩综合课程 LLM Quantization and Compression: Theoretical Core

广告也精彩

大语言模型量化与压缩综合课程 LLM Quantization and Compression: Theoretical Core

LLM量化与压缩:理论基础(无需编程),掌握大型语言模型 (LLM) 量化和压缩的理论基础,了解如何优化最先进的 AI 模型以实现高效部署——无需编写任何代码。现代大型语言模型包含数十亿个参数,因此训练和部署的计算成本非常高昂。构建可用于生产环境的人工智能系统需要的远不止编程技能;它还需要对模型优化、数学原理、硬件限制、压缩技术和架构权衡有深刻的理解。

本课程旨在从基本原理出发,构建这些概念基础。课程重点不在于实现细节或编码语法,而是培养理解LLM如何在云端、边缘和移动环境中高效压缩、加速和部署所需的思维模型。

完成本课程后,您将了解:

  • 模型压缩的数学基础
  • 训练后量化(PTQ)
  • 量化感知训练(QAT)
  • 激活感知权重量化(AWQ)
  • GPTQ 和高级量化技术
  • 低秩自适应(LoRA)
  • QLoRA 和参数高效的微调
  • 结构化和非结构化剪枝方法
  • 知识提炼
  • 混合精度推理
  • 硬件感知优化
  • 性能、延迟、内存和可扩展性之间的权衡
  • 部署策略和生产最佳实践

本课程非常适合:

  • 人工智能工程师和机器学习工程师
  • LLM工程师
  • 人工智能平台架构师
  • 系统工程师
  • 基础设施和MLOps工程师
  • 硬件-软件协同设计工程师
  • 技术主管和工程经理
  • 研究人员和研究生
  • 任何想了解LLM优化而无需编程的人

格 式:MP4
分 辨 率:高清1280×720
语言字幕:英语,AI精翻中文字幕
大 小:3.03 GB

资源下载
仅限VIP下载
网盘链接失效,客服QQ:2995738052,本网站压缩包解压需要密码统一是:www.cgzyw.com

版权声明:资源来源于互联网收集整理,仅供学习交流,如果喜欢请支持正版。
本站仅作为资源信息收集站点,无法保证资源的可用及完整性,不提供任何资源安装使用及技术服务。请自己研究文档

广告也精彩
 

发表评论