LogoCookLLM文档
LogoCookLLM文档
首页CookLLM - LLM 系统课程

核心课程

Basics
GPU 编程基础
FlashAttention
并行策略 (Parallelism)
量化技术 (Quantization)
激活检查点 (Activation Checkpointing)
CPU 卸载 (CPU Offloading)
推理优化 (Inference)
Scaling Laws
Data
Alignment
Systems

inference

inference module

登录以继续阅读

这是一篇付费内容,请登录您的账户以访问完整内容。

cpu-offloading

cpu-offloading module

Scaling Laws:缩放定律

Scaling sequence, Model complexity, Loss metric