Categories
技术
大模型学习笔记:从 Loss 到梯度下降