梯度下降算法与Normal equation

Normal equation: Method to solve for θ analytically

正规方程：分析求解θ的方法

对于损失函数

\[J\left( {{\theta _0},{\theta _1},...,{\theta _n}} \right) = \frac{1}{{2m}}\sum\limits_{i = 1}^m {{{\left( {{h_\theta }\left( {{x^{\left( i \right)}}} \right) - {y^{\left( i \right)}}} \right)}^2}} \]

只要满足

\[\frac{\partial }{{\partial {\theta _1}}}J\left( \theta \right) = \frac{\partial }{{\partial {\theta _2}}}J\left( \theta \right) = \cdot \cdot \cdot = \frac{\partial }{{\partial {\theta _n}}}J\left( \theta \right) = 0\]

就可以直接得到所有的参数

\[{{\theta _0},{\theta _1},...,{\theta _n}}\]

而满足上面的连续等式的解是

\[\theta = {\left( {{X^T}X} \right)^{ - 1}}{X^T}y\]

其中

\[X = \left[ {\begin{array}{*{20}{c}}
{\begin{array}{*{20}{c}}
{1,x_1^{\left( 1 \right)},x_2^{\left( 1 \right)},...,x_n^{\left( 1 \right)}}\\
{1,x_1^{\left( 2 \right)},x_2^{\left( 2 \right)},...,x_n^{\left( 2 \right)}}\\
\begin{array}{l}
\cdot \\
\cdot
\end{array}
\end{array}}\\
{1,x_1^{\left( m \right)},x_2^{\left( m \right)},...,x_n^{\left( m \right)}}
\end{array}} \right]\]

是变量的矩阵；

\[y = \left[ {\begin{array}{*{20}{c}}
{\begin{array}{*{20}{c}}
{{y^{\left( 1 \right)}}}\\
{{y^{\left( 2 \right)}}}\\
\begin{array}{l}
\cdot \\
\cdot
\end{array}
\end{array}}\\
{{y^{\left( m \right)}}}
\end{array}} \right]\]

是对应的输出值

Gradient Descent	Normal Equation
Need to choose α	No need to choose α
Needs many iterations	Don‘t need to iterate
Works well even when n is large	O(n³)Need to compute ()
O(kn²)	Slow if n is very large

如果矩阵不可逆，可以计算伪逆矩阵。

原文地址：https://www.cnblogs.com/qkloveslife/p/9839607.html

时间： 2024-11-07 05:48:26

梯度下降算法与Normal equation

梯度下降算法与Normal equation的相关文章

机器学习笔记02：多元线性回归、梯度下降和Normal equation

Linear regression with multiple variables(多特征的线型回归)算法实例_梯度下降解法(Gradient DesentMulti)以及正规方程解法(Normal Equation)

简单多元线性回归（梯度下降算法与矩阵法）

（三）Normal Equation

转载：Normal Equation证明及应用

斯坦福CS229机器学习课程笔记一：线性回归与梯度下降算法

梯度下降算法(1) - Python实现

正规方程（Normal Equation）——对于线性回归问题的一种快速解法

[ML]简单的Normal Equation对数据点进行线性回归