矩阵的韦达定理,非对称的韦达定理是怎么产生的

首页 > 大全 > 作者：YD1662022-12-29 00:30:36

矩阵的韦达定理,非对称的韦达定理是怎么产生的(1)

作者 | 小小挖掘机
来源 | SIGAI

数学

1.列举常用的最优化方法

梯度下降法

牛顿法，

拟牛顿法

坐标下降法

梯度下降法的改进型如AdaDelta，AdaGrad，Adam，NAG等。

2.梯度下降法的关键点

梯度下降法沿着梯度的反方向进行搜索，利用了函数的一阶导数信息。梯度下降法的迭代公式为：

矩阵的韦达定理,非对称的韦达定理是怎么产生的(2)

根据函数的一阶泰勒展开，在负梯度方向，函数值是下降的。只要学习率设置的足够小，并且没有到达梯度为0的点处，每次迭代时函数值一定会下降。需要设置学习率为一个非常小的正数的原因是要保证迭代之后的xk 1位于迭代之前的值xk的邻域内，从而可以忽略泰勒展开中的高次项，保证迭代时函数值下降。

梯度下降法只能保证找到梯度为0的点，不能保证找到极小值点。迭代终止的判定依据是梯度值充分接近于0，或者达到最大指定迭代次数。

梯度下降法在机器学习中应用广泛，尤其是在深度学习中。AdaDelta，AdaGrad，Adam，NAG等改进的梯度下降法都是用梯度构造更新项，区别在于更新项的构造方式不同。

3.牛顿法的关键点

牛顿法利用了函数的一阶和二阶导数信息，直接寻找梯度为0的点。牛顿法的迭代公式为：

矩阵的韦达定理,非对称的韦达定理是怎么产生的(3)

其中H为Hessian矩阵，g为梯度向量。牛顿法不能保证每次迭代时函数值下降，也不能保证收敛到极小值点。在实现时，也需要设置学习率，原因和梯度下降法相同，是为了能够忽略泰勒展开中的高阶项。学习率的设置通常采用直线搜索（line search）技术。

在实现时，一般不直接求Hessian矩阵的逆矩阵，而是求解下面的线性方程组：

矩阵的韦达定理,非对称的韦达定理是怎么产生的(4)

首页 12 3 4 5 下一页

栏目热文

如意吉祥寓意（吉祥和如意哪个寓意好）
阅读全文>>2023-01-13 19:43:24
斗鱼未来互娱（企鹅电竞斗鱼合并）
阅读全文>>2022-12-27 04:15:24
中年婚姻搞笑句子（婚姻中的搞笑句子）
阅读全文>>2023-01-21 10:41:44
儿童蜡笔画获奖作品（儿童蜡笔绘画大赛获奖作品）
阅读全文>>2023-02-12 23:20:46
张富源简介（张富源为什么退役）
阅读全文>>2022-12-08 17:12:43
四十岁生日微信说说（女人四十生日发朋友圈的说说）
阅读全文>>1970-01-01 08:00:00
武胜食品监督局电话（武胜食品监管局）
阅读全文>>2022-12-19 05:30:18
考摩托车车证要什么条件（考摩托车证有什么流程和规定）
阅读全文>>2023-01-23 00:10:45
日本崛起是通过什么实现的（日本崛起是从什么时候开始的）
阅读全文>>2022-12-22 12:59:09
动物单独纹样图案彩色（花卉单独纹样图案彩色）
阅读全文>>2023-04-17 12:44:42

文档排行

本站推荐

四川成都优待证领取通知（成都优待证下发时间表）
阅读全文>>2022-10-30 09:18:21
代驾可以同时做二个平台吗（代驾可以注册多个平台吗）
阅读全文>>2022-11-13 23:58:54
火山小视频合拍功能在哪里（火山小视频怎么和别人合拍）
阅读全文>>2023-11-14 01:22:48
双萃精华娇韵诗和小棕瓶哪个好用（女人必买香水前十名）
阅读全文>>2023-05-22 22:15:37
紫色外套里面搭什么颜色好看（香芋紫和什么颜色最搭）
阅读全文>>2023-05-11 23:04:54
白色硅胶手机壳黑了怎么清洗（硅胶手机壳黑了怎样才能清洗干净）
阅读全文>>2024-02-24 09:01:47

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.