通过一个简单的向量加法例子,学习 Triton 的基本编程模型。
这是一篇付费内容,请登录您的账户以访问完整内容。
张量布局
深入理解张量在内存中的物理布局,Strides,View 与 Reshape 的区别,以及梯度追踪机制。
Flash Attention
深入理解 Flash Attention 的原理与 Triton 实现