LogoCookLLM文档
LogoCookLLM文档
首页CookLLM - LLM 系统课程

核心课程

Basics
Scaling Laws
Data
Alignment
监督微调 (SFT)
强化学习 (RLHF)
偏好数据 (Preference Data)
合成数据 (Synthetic Data)
验证器 (Verifiers)

Alignment:对齐技术

SFT, RLHF, Preference data, Synthetic data

概述

这里是 Alignment 模块。

登录以继续阅读

这是一篇付费内容,请登录您的账户以访问完整内容。

mixing

mixing module

sft

sft module

目录

概述