如何理解梯度下降法？ - 程序猿·D·安宇雨 DeepMind

如何理解梯度下降法？

安宇雨 - 随手采集
2021-01-14 11:02:02
随手采集
0000-未整理-等待研究

下面是机器学习的《监督式学习》课程中“逻辑回归”单元的内容，感兴趣的同学可以点击最下方的阅读原文购买。

梯度下降法是用来计算函数最小值的。它的思路很简单，想象在山顶放了一个球，一松手它就会顺着山坡最陡峭的地方滚落到谷底：

凸函数图像看上去就像上面的山谷，如果运用梯度下降法的话，就可以通过一步步的滚动最终来到谷底，也就是找到了函数的最小值。

1 动机

先解释下为什么要有梯度下降法？其实最简单的二维凸函数是抛物线，很容易通过解方程求出最小值在处：

只是有一些凸函数，比如下面这个二元函数（该函数实际上是逻辑回归的经验误差函数，在监督式学习中确实需要求它的最小值）：要求它的最小值点就需要解如下方程组：

这个方程组实在太复杂了，直接求解难度太高，好在的图像就像一座山谷：

所以可以用梯度下降法来找到的谷底，也就是最小值。

2 最简单的例子

梯度下降法在本文不打算进行严格地证明和讲解，主要通过一些例子来讲解，先从最简单的凸函数开始讲起。

2.1 梯度向量

假设起点在处，也就是将球放在：

它的梯度为 1 维向量：这是在轴上的向量，它指向函数值增长最快的方向，而就指向减少最快的方向：

将也看作 1 维向量，通过和相加，可以将之向移动一段距离得到新的向量：其中称为步长，通过它可以控制移的动距离，本节设，那么：此时小球（也就是起点）下降到了这个位置：

2.2 迭代

的梯度为：继续沿着梯度的反方向走：小球就滚到了更低的位置：

重复上述过程到第 10 次，小球基本上就到了最低点，即有：

2.3 梯度下降法

把每一次的梯度向量的模长列出来，可以看到是在不断减小的，因此这种方法称为梯度下降法：

这也比较好理解，当最终趋向于 0 时有：所以梯度下降法求出来的就是最小值（或者在附近）。

3 步长

上面谈到了可以通过步长来控制每次移动的距离，下面来看看不同步长对最终结果的影响。

3.1 过小

如果设就过于小了，迭代 20 次后离谷底还很远，实际上 100 次后都无法到达谷底：

3.2 合适

上面例子中用的是较为合适的步长，10 次就差不多找到了最小值：

3.3 较大

如果令，这个时候会来回震荡（下图看上去只有两个点，实际上在这两个点之间来来回回）：

3.4 过大

继续加大步长，比如令，反而会越过谷底，不断上升：

3.5 总结

总结下，不同的步长，随着迭代次数的增加，会导致被优化函数的值有不同的变化：

寻找合适的步长是个手艺活，在工程中可以将上图画出来，根据图像来手动调整：

往上走（红线），自然是过大，需要调低
一开始下降特别急，然后就几乎没有变化（棕线），可能是较大，需要调低
几乎是线性变化（蓝线），可能是过小，需要调高

4 三维的例子

原理都介绍完了，下面再通过一个三维的例子来加强对梯度下降法的理解。假设函数为：

其图像及等高线如下（等高线中心的蓝点表示最小值）:

下面用梯度下降法来寻找最小值。

4.1 前进一步

设初始点为，此时梯度为：令步长，那么下一个点为：可以看到向最小值方向前进了一步：

4.2 迭代

同样的方法找到下一个点：此时又向最小值靠近了：

如此迭代20次后，差不多找到了最小值：

我们通过通俗易懂、图形化的方式，对机器学习中的《监督式学习》进行了精讲，目前还在连载中，可以享受早鸟价格，可以点击下面的链接购买：

机器学习之《监督式学习》

👉 也可以直接点击下面这个图片购买机器学习的前置课程，《线性代数》、《单变量微积分》、《多变量微积分》、《概率论与数理统计》：

最易懂的数学知识库：

马同学图解数学

看得懂的数学

微信公众号ID ：matongxue314

原网址: 访问
创建于: 2021-01-14 11:02:02
目录: default
标签: 无

未标明原创文章均为采集，版权归作者所有，转载无需和我联系，请注明原出处，南摩阿彌陀佛，知识，不只知道，要得到

上一篇：全球主流社交媒体算法解析：Facebook、YouTube、Twitter如何利用算法推荐内容？
下一篇： 2020 几款常用 Redis 可视化工具

请先后发表评论

最新评论
总共0条评论

加入组织

1. 手Q扫左侧二维码

2. 搜Q群：861085013

3. 点击

热门标签

最新评论

我是果粉我怕谁2025-03-22 12:33:13
在KBDfans 传承经典灵感源计算机 ...中评论
测评视频：【是的我买了把古早笑话 / Command65 R2】https://...

我是果粉我怕谁2024-02-22 16:27:15
在用arthas定位程序响应缓慢故障-天翼...中评论
[arthas@21932]$ profiler startAsyncProfi...

我是果粉我怕谁2024-02-21 11:26:28
在SpringBoot:Windows平台...中评论
文章提到的cronolog.exe，在https://deepmind.t-sa...

我是果粉我怕谁2023-07-28 16:45:41
在问题记录2 - SpringBoot+Z...中评论
InterProcessMutex mutex = new InterProce...

我是果粉我怕谁2023-06-06 14:23:41
在如何使用 Apache POI 在 Wo...中评论
不大行，到底哪里有问题？1. 没有分页，内容全在同一页；

上海晶珩EDATEC2023-03-24 11:17:58
在树莓派打造成小型PLC工控机(CodeS...中评论
使用真正的树莓派工控机开发CodeSys是否更好？网上看到过上海晶珩的树莓派工...

我是果粉我怕谁2023-03-23 10:00:15
在u2u转换板 - 嘉立创EDA开源硬件平...中评论
https://github.com/tmk/USB2USB_Converter...

我是果粉我怕谁2023-03-23 10:00:08
在u2u转换板 - 嘉立创EDA开源硬件平...中评论
https://github.com/tmk/HHKB_controller

我是果粉我怕谁2023-03-23 09:57:41
在u2u转换板 - 嘉立创EDA开源硬件平...中评论
usb-to-usb-converter

我是果粉我怕谁2023-03-23 09:43:52
在u2u转换板 - 嘉立创EDA开源硬件平...中评论
Hasu USB to USB Controller Converter

我是果粉我怕谁2023-03-23 09:40:37
在u2u转换板 - 嘉立创EDA开源硬件平...中评论
u2u converter

我是果粉我怕谁2023-03-23 09:40:28
在u2u转换板 - 嘉立创EDA开源硬件平...中评论
U2U Adapter

空灵橙子2023-03-17 13:16:32
在树莓派打造成小型PLC工控机(CodeS...中评论
您好，我们想进行文章方面的合作，请问怎么可以联系到您？

JUSTwithBG2023-03-10 11:48:16
在GoLand激活码，2022年最新永久激...中评论
刚在b站试了大佬的教程，牛逼炸了。goland官网最新版2022.3.2直接激活...

我是果粉我怕谁2022-10-03 18:16:30
在自行搭建开坑真正的客制化中评论
YUNRUN60铝合金外壳

我是果粉我怕谁2022-10-03 18:15:04
在自行搭建开坑真正的客制化中评论
当cheap60不再cheap？五鱼SARDINE 64 PC一体升级下盖！

我是果粉我怕谁2022-09-16 01:38:20
在Google 的核心 Java 库 gu...中评论
别再造轮子了，Google 开源的 Guava 工具库真心强大！https://...

我是果粉我怕谁2022-09-15 20:59:33
在如何访问gorm.Model.ID？--...中评论
I worked with this: removing package Nam...

我是果粉我怕谁2022-07-26 23:20:02
在GoLand激活码，2022年最新永久激...中评论
每天提供两个地址，保证有效！百度网盘：链接: https://pan.baidu...

我是果粉我怕谁2022-07-26 12:00:18
在go get更换国内镜像源_goldVi...中评论
Go Modules Environment

友情链接

Laravel China 简书知乎博客园 CSDN博客开源中国 Go Further Ryan是菜鸟 | LNMP技术栈笔记云栖社区-阿里云 Netflix技术博客 Techie Delight Linkedin技术博客 Dropbox技术博客 Facebook技术博客淘宝中间件团队美团技术博客 360技术博客古巷博客 - 一个专注于分享的不正常博客软件测试知识传播 - 测试窝有赞技术团队阮一峰语雀静觅丨崔庆才的个人博客软件测试从业者综合能力提升 - isTester IBM Java 开发使用开放 Java 生态系统开发现代应用程序 pengdai 一个强大的博主 HTML5资源教程 | 分享HTML5开发资源和开发教程蘑菇博客 - 专注于技术分享的博客平台个人博客-leapMie 流星007 CSDN博客 - 舍其小伙伴稀土掘金 Go 技术论坛 | Golang / Go 语言中国知识社区