Roadmap

Explore our future plans and upcoming course modules

Overall progress14/29 completed

48%

Backlog

Modern Transformer tricks doclow

Harry

KV Cache & text generation docmedium

Harry

Evaluation metrics doclow

Harry

RLHF: PPO training doc and codemedium

Harry

DPO (Direct Preference Optimization) doc and codemedium

Harry

GRPO (Group Relative Policy Optimization) doc and codemedium

Harry

Build a mini vLLM inference enginehigh

Harry

Multimodal model doc and codemedium

Harry

LLM Agent framework doc and codemedium

Harry

In Progress

Introduce modern LLM model architectures designshigh

Harry

Normalization doc (BatchNorm → RMSNorm)medium

Harry

Activation functions doc (ReLU → SwiGLU)medium

Harry

Optimizer theory doc (Adam → Muon)medium

Harry

Training techniques doc (LR schedule, mixed precision)medium

Harry

SFT (Supervised Fine-Tuning) doc and codemedium

Harry

Done

Introduce LLM tokenizerhigh

Harry2026-01-17

Training tokenizer from scratchhigh

Harry2026-01-17

Flash Attention doc and codehigh

Harry2025-12-15

GPU programming doc and codehigh

Harry2025-12-15

RoPE position encoding doc and codehigh

Harry2026-02-10

build the cookllm-bento codebasehigh

Harry2026-01-28

Training: tokenizer hands-on (RustBPE + tiktoken)high

Harry2026-02-05

Training: BentoLM architecture design & implementationhigh

Harry2026-02-14

Training: pretrain pipeline (data, loop, monitoring)high

Harry2026-02-20

Training: pretrain inference & text generationmedium

Harry2026-02-22

Introduce training parallelism modulehigh

Harry2026-03-12

Transformer LM doc (overview, embedding & LM head)high

Harry2026-04-08

Attention mechanism doc (+ attention sink)medium

Harry2026-05-14

Coding harness doc & code (cookllm-harness)high

Harry2026-06-06