第一页纸定义了损失函数的样子, theta, X 和 y 的 shape, 以及最终的损失函数向量表现形式.
第二页纸抄上了几个要用到的矩阵求导公式,以及推导过程和结果.
要说明的是:推导结果与theta, X 和 y 的 shape有直接关系.也就是说可能和某教材,某大牛教学视频的结论外貌上不一致,但实质完全相同.
时间: 2024-11-11 09:29:18
第一页纸定义了损失函数的样子, theta, X 和 y 的 shape, 以及最终的损失函数向量表现形式.
第二页纸抄上了几个要用到的矩阵求导公式,以及推导过程和结果.
要说明的是:推导结果与theta, X 和 y 的 shape有直接关系.也就是说可能和某教材,某大牛教学视频的结论外貌上不一致,但实质完全相同.