二次型的意义是什么?有什么应用?

论坛 期权论坛 study     
刀刀君   2018-10-23 00:36   15977   9
1#
郭靖  3级会员 | 2016-4-14 12:08:38 发帖IP地址来自
给出一个图形的方程,即使它不是那种标准的图形的方程,比如不是标准圆和标准椭圆的方程,有旋转有偏移。利用二次型,也可以在坐标系下绘出它的图形。
     我说的标准,是指中心在原点,长轴短轴分别和坐标轴重合。
2#
马同学  4级常客 | 2017-7-8 18:58:58 发帖IP地址来自
通过矩阵来研究二次函数(方程),这就是线性代数中二次型的重点。
1 二次函数(方程)的特点
1.1 二次函数
最简单的一元二次函数就是:

给它增加一次项不会改变形状:



增加常数项就更不用说了,更不会改变形状。
1.2 二次方程
下面是一个二元二次方程:

给它增加一次项也不会改变形状,只是看上去有些伸缩:

1.3 小结
对于二次函数或者二次方程,二次部分是主要部分,往往研究二次这部分就够了。
2 通过矩阵来研究二次方程
因为二次函数(方程)的二次部分最重要,为了方便研究,我们把含有
个变量的二次齐次函数:


称为二次型。
2.1 二次型矩阵
实际上我们可以通过矩阵来表示二次型:

更一般的:

可以写成更线代的形式:

所以有下面一一对应的关系:

在线代里面,就是通过一个对称矩阵,去研究某个二次型。
2.2 通过矩阵来研究有什么好处
2.2.1 圆锥曲线
我们来看下,这是一个圆:

我们来看改变一下二次型矩阵:

哈,原来椭圆和圆之间是线性关系呐(通过矩阵变换就可以从圆变为椭圆)。
继续:

咦,双曲线和圆之间也是线性关系。
其实圆、椭圆、双曲线之间关系很紧密的,统称为圆锥曲线,都是圆锥体和平面的交线:

从上面动图可看出,一个平面在圆锥体上运动,可以得到圆、椭圆、双曲线,这也是它们之间具有线性关系的来源(平面的运动实际上是线性的)。
2.2.2 规范化
再改变下矩阵:

这个椭圆看起来有点歪,不太好处理,我们来把它扶正,这就叫做规范化。
如果我们对矩阵有更深刻的认识,那么要把它扶正很简单。
往下读之前,请先参看我在 如何理解特征值 下的回答。
首先,矩阵代表了运动,包含:
  • 旋转
  • 拉伸
  • 投影
对于方阵,因为没有维度的改变,所以就没有投影这个运动了,只有:
  • 旋转
  • 拉伸
具体到上面的矩阵:

我把这个矩阵进行特征值分解:

注意我上面提到的正交很重要,为什么重要,可以参看我在 如何理解特征值
对于二次型矩阵,都是对称矩阵,所以特征值分解总可以得到正交矩阵与对角矩阵。
特征值分解实际上就是把运动分解了:

那么我们只需要保留拉伸部分,就相当于把矩阵扶正(图中把各自图形的二次型矩阵标注出来了):

所以,用二次型矩阵进行规范化是非常轻松的事情。
2.2.3 正定
正定是对二次函数有效的一个定义,对方程无效。
对于二次型函数,


  • ,则
    为正定二次型,
    为正定矩阵

  • ,则
    为半正定二次型,
    为半正定矩阵

  • ,则
    为负定二次型,
    为负定矩阵

  • ,则
    为半负定二次型,
    为半负定矩阵
  • 以上皆不是,就叫做不定
从图像上看,这是正定:

半正定:

不定:

既然二次型用矩阵来表示了,那么我们能否通过矩阵来判断是否正定呢?
下面我分别给出了二次型的图形,以及对应的特征值矩阵的图形,你可以自己动手试试(3D窗口可以通过鼠标旋转,方便观察),得出自己的结论:


此处有互动内容,点击此处前往操作。
起码,我们可以观察出这个结论,特征值都大于0,则为正定矩阵。
3 总结
在很多学科里,二次型都是主要研究对象,很多问题都可以转为二次型。线代作为一门数学工具,在二次型的研究中也发挥了很好的作用。
最新版本(可能有后继更新):如何理解二次型?
3#
龙fly  4级常客 | 2017-7-8 19:10:50 发帖IP地址来自
二次型可以表示很多曲线和曲面,尤其可以用了研究高维状态下的曲面。写出二次型的式子看看,每个平方项前面系数是可以改变的。
4#
匿名用户   | 2017-7-8 20:46:37 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
5#
Chan James  1级新秀 | 2017-7-8 21:21:34 发帖IP地址来自
自滤应滤波,代价函数是二次型
6#
追寻炼金师的脚步  2级吧友 | 2017-7-23 19:19:24 发帖IP地址来自
目标函数在极小点附近作泰勒展开:


如果忽略高阶项就是一个正定二次型,其中 G 为在极小值点的Hesse矩阵((半)正定). 因而可知一般函数在极小点附近可以用正定二次函数很好地近似,因此能否有效的求得正定二次函数的极小点,是检验一个优化算法(好多及其学习的算法最后都要用到数值优化的算法)好坏的标准之一。称为二次终止性.  同时二次型也是个凸函数,凸优化在机器学习中也有很多应用。
7#
张智浩  2级吧友 | 2017-7-23 23:39:36 发帖IP地址来自
很多答案都已经说了“应用”了,我就来勉强说一说“意义”,当然我其实也不太懂,只是把一些思考摆出来,权当抛砖引玉了。
(注意:按照我的一贯风格,下面与问题无关的废话相当多)


以前我也跟同学讨论过类似的问题:线性代数为什么要学二次型这种东西?一般而言,一本相对基础而又相对完整的线性代数教材至少会包含以下内容:线性空间和线性映射的基本性质、线性算子的标准型、二次型和双线性型理论;第一部分为基础,后两部分相对独立。第一部分是明确了我们所研究的范畴,那么为什么有后面两个部分?
我觉得这可能是一种研究“几何”的动机。第一部分至多提供了一个“纯粹的线性空间”的几何,我们能够对一个什么都没有的线性空间的结构了解得很清楚:它是由一组基生成的,不同的基直接有何关系。但是这显得太过于简单了,并没有什么可研究的。这部分内容我认为可以用两句话概况:线性空间和线性映射的范畴是个 Abel 范畴,每个线性空间都有维数。
第二部分可以算是研究“带有一个线性算子的线性空间”的几何,虽然我们的主要工具是 PID 上有限生成模,代数意味显得比几何意味更浓。其实硬要说我觉得前两个部分并不怎么“几何”,感觉都是结构定理为主。
第三部分应该才算是几何了,主要研究“带有一个二次型或者双线性型的线性空间”的几何。在给出了适当的结构定理之后,我们可以确定出一系列
的子群(保持这个二次型不变的线性变换),它们的重要性是毋庸置疑的;然后以这个“带有结构的线性空间”作为 model 将其“仿射化”就开启了最简单的线性的几何的研究。这个“仿射化”是我自己不知道如何表达而造的词(可能有这样的词了只是我不知道),意思就是以一个线性空间为 model 作一个仿射空间并且把这个线性空间上面的二次型或者双线性型也搬到这个仿射空间上面去;例如,一个欧几里得空间就是一个带有正定内积的实线性空间的“仿射化”,自然一个仿射空间就是一个什么都没有的线性空间的“仿射化”了。
如果认为仿射几何是最简单的几何,那这样得到的无疑是第二简单的几何了。这些几何自然是 Klein 意义下的几何,涉及到的群总是会跟前面给出的
的子群有关。
说到二次型和几何那 Clifford 代数总是绕不开的话题。
(哎我全都不懂我不写了。。我就是那种“来自中国大陆”又只能“大谈数学的哲学,而不能坐下来做扎实的计算”的学生)
8#
杨柳  4级常客 | 2017-7-25 13:32:53 发帖IP地址来自
二次型是多线性代数(张量代数)的玩具。
9#
lixin liu  2级吧友 | 2017-7-25 16:09:05 发帖IP地址来自
要说意义其实很简单呀。
二次型就是多元的二次函数而已。

中学的时候会先学一次函数,y=ax,然后又二有二次函数y=ax^2,但这里自变量都是一元的。如果你觉得这个逻辑很正常,那么我们把它们扩展到多元情形就可以自然引出二次型。
如果有多个自变量。那么一次函数就是他们的线性组合y=a1x1+...anxn,用矩阵符号可以简化这个表达y=Ax,而二次函数就是这些自变量自己的平方加上两两乘积,用矩阵符号简化为xTAx。
二次型在数学很多分支里都频繁出现,而且在其他学科也到处可见。比如实二次型
,似乎在非常多的应用中都出现过,比如优化、概率图论、统计、机器学习、信号处理等等。

那么,二次型在你所学的领域有什么应用呢?

希望大家能列出二次型在自己领域内对应的具体问题,是如何求解的等等。当然,也包括在数学分支内的应用。
分享到 :
0 人收藏

9 个回复

倒序浏览
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:
精华:
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP