CookLLM Docs

Home CookLLM

Principles

Tokenization

Tokenization Basics BPE Algorithm GPT Tokenizers BPE Training Engineering

Model Architecture

Attention Mechanisms

Position Encoding

Position Encoding Basics RoPE Math Derivation RoPE Implementation Length Extrapolation

GPU Programming Basics

GPU Architecture Basics Tensor Layout Triton Basics: Vector Add

FlashAttention

Flash Attention Principles From Naive to Auto-Tuning Block Pointers and Multi-Dim Support Causal Masking Optimization Grouped Query Attention Backward Pass

Hands-on Training

CookLLM Docs

Home CookLLM

Principles

Tokenization

Tokenization Basics BPE Algorithm GPT Tokenizers BPE Training Engineering

Model Architecture

Attention Mechanisms

Position Encoding

Position Encoding Basics RoPE Math Derivation RoPE Implementation Length Extrapolation

GPU Programming Basics

GPU Architecture Basics Tensor Layout Triton Basics: Vector Add

FlashAttention

Flash Attention Principles From Naive to Auto-Tuning Block Pointers and Multi-Dim Support Causal Masking Optimization Grouped Query Attention Backward Pass

Hands-on Training

FundamentalsTokenization

Tokenization Basics

Premium

Why tokenization? From character-level to subword-level, with Unicode and UTF-8

Log in to continue reading

This is premium content. Please log in to access the full article.

Tokenization

Deeply understand LLM tokenization, from BPE to GPT implementations

BPE Algorithm

Deep dive into Byte Pair Encoding, with manual training, encoding, and decoding

Why Tokenization

Start With Character-Level Tokenization

Character-Level Workflow

Limitations of Character-Level Tokenization

Unicode and UTF-8: Multi-language Support

What Is Unicode

UTF-8 Encoding

Why Not Use UTF-8 Bytes Directly?

Summary

FundamentalsTokenization

Tokenization Basics

Premium

Why tokenization? From character-level to subword-level, with Unicode and UTF-8

Log in to continue reading

This is premium content. Please log in to access the full article.

Tokenization

Deeply understand LLM tokenization, from BPE to GPT implementations

BPE Algorithm

Deep dive into Byte Pair Encoding, with manual training, encoding, and decoding

Why Tokenization

Start With Character-Level Tokenization

Character-Level Workflow

Limitations of Character-Level Tokenization

Unicode and UTF-8: Multi-language Support

What Is Unicode

UTF-8 Encoding

Why Not Use UTF-8 Bytes Directly?

Summary

Tokenization Basics

Log in to continue reading

Table of Contents

Tokenization Basics

Log in to continue reading

Table of Contents