正定矩阵定义为每个特征值为正的对称矩阵。
好吧,但你可能想知道,“我们为什么要定义这样的东西?它在某种程度上有用吗?为什么特征值的符号很重要?”
这很好,但是你能提供更多的想法来支持它吗?
正定矩阵的几何解释让我们在脑海中塑造一个形象。
有一个向量z。
而这个向量z会指向某个方向。
当我们将矩阵M乘以z时,z不再指向同一方向。z的方向由M变换。
如果 M 是正定矩阵,则新方向将始终指向“相同的一般”方向,这意味着角度变化小于 π/2。
换句话说,它不会将矢量的原始方向改变超过 90 度。
但为什么会这样呢?
因为zT Mz是z和Mz的内积。余弦在 π/2 之前都是正的。
由此,我们还得到了一个奖励项:如果角度小于或等于π/2,则为半正定矩阵。
正定矩阵和特征值之间有什么联系?如果Mz = λz(这是特征值的定义),
则z.TMz = z.Tλz = λ‖z²‖。由于z.TMz > 0,且‖z²‖ > 0,特征值 ( λ ) 必须大于 0!∴ 正定矩阵必须具有正特征值。(“ zT ”是 z 转置。Medium 不允许我在我的博客上写转置上标...)
为什么我们需要正定矩阵?
如果您可以将一些矩阵与一个向量相乘任意次数并且向量的符号不会改变,那不是很好吗?就像将多个正数相乘一样,结果的符号不会改变。我认为这是矩阵(或任何东西)拥有的一个很好的属性。
此外,如果函数的 Hessian 矩阵是正定矩阵,则该函数是凸函数。
在微积分中,当函数处于最大值或最小值时,函数的导数等于零。检查二阶导数的符号可以告诉我们它是最大值还是最小值。在多维中,我们不再有一个数字可以检查;相反,我们有一个 Hessian 矩阵。
如果 Hessian 是正定的,则它是最小值。如果 Hessian 是负定的,则它是最大值。
如果您知道任何其他原因,请在评论中留下它们!
应用正定矩阵除了出现在微积分教科书中之外,还有实际应用。
您可以通过Cholesky 分解来模拟相关货币的走势!
这是一种古老的方法,但仍然有效。
Cholesky 分解简而言之:每个对称正定矩阵M都可以分解为唯一下三角矩阵L与其转置LT的乘积。在求解线性方程组时,Cholesky 分解的效率大约是上下 (LU) 分解的两倍。
蒙特卡洛方法已用于经典期权定价,其中收益取决于一揽子标的资产。对于一篮子n种资产,相关矩阵 Σ 是对称且正定的,因此可以分解为Σ = L*LT,其中L是下三角矩阵。然后可以将相关货币变动计算为L* 随机货币变动(基本上是随机数)。
Cholesky 分解也用于卡尔曼滤波器,甚至用于矩阵求逆。
附录:
厄密矩阵Hermitian 矩阵是一个方阵,其转置矩阵与其共轭矩阵 (M = MT) 相同。厄密矩阵的所有非对角线元素都是复数。
但是对于复数,必须扩展对称的概念。
如何?每个非对角线项都与其他项共轭。即2–3i 是2 3i 的共轭。
M = | 1 2 3i |
| 2-3i 8 |
对角线条目是真实的。因此,实对称矩阵是 Hermitian 的特例。