为什么要对 loss function 求偏导数?

不要想这么复杂, 我们先想简单一些的东西.

如图所示, 假设有一个一元函数 f(x) . 我们现在在 A(x_0,f(x_0)) 点, 我们想去 (a,f(a)) , 那么我们到底该向右走还是向左走呢? 很简单, 因为


这是一个从 https://www.zhihu.com/question/587023515/answer/2919607162 下的原始话题分离的讨论话题