LogoCookLLM文档
LogoCookLLM文档
首页CookLLM - LLM 系统课程

核心课程

Basics
Scaling Laws
Data
Alignment
监督微调 (SFT)
强化学习 (RLHF)
偏好数据 (Preference Data)
合成数据 (Synthetic Data)
验证器 (Verifiers)
Alignment

verifiers

verifiers module

登录以继续阅读

这是一篇付费内容,请登录您的账户以访问完整内容。

synthetic-data

synthetic-data module