10

如果看了这些还不懂线性代数,你就来锤我和广坤

 4 years ago
source link: http://mp.weixin.qq.com/s?__biz=MzUxNDMzMjgxNQ%3D%3D&%3Bmid=2247490799&%3Bidx=1&%3Bsn=674c02fccdea741c538bf68206b7990d
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

引言: 线性代数是数据科学的基础知识之一, 3Blue1Brown 也是非常有名的数学讲解频道。去年TDU的谢洛克在学习过 3Blue1Brown 线性代数的视频后,写下了备受欢迎的两篇学习笔记,再次分享给大家,同时也推荐有线性代数学习需求的伙伴们去看这一系列的视频。

NRZfUba.png!web

多年以后,当谢洛克站在菲尔兹奖的领奖台上,一定会想起她看到 3Blue1Brown 视频的那个晚上。

3Blue1Brown 的 Essence of linear algebra 系列视频(链接见文末)是我迄今见过最棒的线性代数视频。

Grant Sanderson(3Blue1Brown 创办者)一反教科书上抽象、枯燥的公式教学,引导观众进入奇妙的“线性代数几何化世界”,用人话讲就是把线性代数可视化了。再加上感人的时长(一共13集,每集仅10分钟左右)、可爱的动画,简直让人爱不释手。

在视频底下的评论也不乏 “万万没想到,从不热爱学习的我竟然被这个数学视频深深吸引了”、“难以置信我竟然心甘情愿为数学熬夜”、“天呐为什么我研究生毕业才看到这个视频,当初我学线代吃了多少苦啊”、“教科书为什么不能跟这看齐”的赞誉之词,可见这系列视频的质量和在群众中的口碑。

好了言归正传。在如饥似渴的学习中我也做了一些学习笔记,在此共享给大家。

简便起见,下面仅讨论二维空间中的情况(更高维的也同理,只需动动你聪明的小脑瓜),所提及的矩阵也仅限于方阵。

  • 向量

向量大家都懂的,请想象一个在坐标轴中有方向、有长度的箭头。

viyuEfA.jpg!web

  • 基向量

向量最本质的两个运算就是数乘( scaling)和加法(additive)。

牢记加法和数乘,你就可以在线性代数的世界里所向披靡。

让我们来看图。  是基向量,二维空间中所有的向量都可以由它们俩的组合来表示(选择 , 是由于它们简洁直观,你也可以选择其他向量作为你的基向量,只要它们不共线就行)。怎么组合?比如 ruyAfai.jpg!web这个向量其实就是 向量反向1倍, 向量伸长2倍,然后相加。基向量的伸长和缩短,就是所谓的数乘,而后的相加就是加法。

zQB7Vvu.jpg!web

  • 线性变化

Znyiqaz.png!web

看到这个,你是不是条件反射式地开始回忆课本上的计算公式,什么捉对相乘再相加之类的。不要这样做。让我们把这些数字放到几何学中,轻松地得出结果。

首先,右边是个向量。如果有个坐标轴,你可以想象出它是从原点出发,箭头在5 7位置的向量。用基向量表示就是 aaeQnmr.jpg!web

左边是个矩阵,矩阵有什么几何意义呢?矩阵的几何意义是线性变换。所谓线性变换,就是坐标轴的旋转、伸缩。下图就是一个线性变换。你可以看到,坐标轴从你熟悉的横平竖直(白格子)变成了斜斜的、长度也有所伸长的新坐标轴(蓝格子)。原来的 变成了橙箭头 B36FFrZ.jpg!web,原来的 变成了绿箭头 。用矩阵表示就是 73EJFby.jpg!web

OK,之后你再见到方阵,你就知道这是一个线性变换,变换后的基向量分别是矩阵的两个列。

所以上面的计算其实是在问,在横平竖直的坐标轴里的向量 ,随着坐标轴经历了 BfAJbi7.jpg!web线性变换后,成了一个新的向量,这个向量是什么?

很好回答。因为线性变换保持网格平行且等距,所以这个向量以前是 JZfEJja.jpg!web

那么变换后依然如此,只不过 换新了。按照下图这样计算就可以了。所以说,万变不离其宗,矩阵乘向量的计算依然是向量运算的本质——数乘和加法(先和基向量数乘,然后相加,即是结果)。

26FVNfb.png!web

到了这里,你已经掌握了几乎所有的核心要点。

  • 矩阵乘法

qyINreU.png!web

你已经理解矩阵乘向量可以看作向量在线性变化后的新位置,那么矩阵乘以矩阵从几何学角度怎么理解呢?抛弃你头脑中那些背下来的公式,回忆一下上一部分的内容。我们把一个矩阵看作线性变换,第一列是 向量,第二列是 向量。那么其实一个矩阵就是两个向量。于是很自然的,这个矩阵左乘一个矩阵,就是对这两个向量分别求新位置。问题又回到了上部分的内容。

  • 行列式

行列式的几何意义是面积变化。在下图中,经历了线性变换后,白网格变成了蓝网格,蓝网格面积除以白网格面积即行列式的值。

在知道变换后基向量的情况下易得这个面积,不过你也可以记忆一个公式,对线性变换 yQb6Jfq.jpg!web而言,它的行列式就是 ad-bc。

MfemIrR.jpg!web

在这一篇中你将了解点乘、你和谢广坤之间的故事以及特征向量特征值。

• 点乘

让我们来看下点乘的计算方式。

f26Vfur.jpg!web

又是捉对相乘再相加,是不是很熟悉?是不是跟矩阵乘以向量是一样一样的。

因此把左边向量看成一个一乘三矩阵,也是完全可以的嘛。但有些同学会说,上一篇只探讨到方阵,突然出现的一乘三的非方阵是怎么回事?

好的,到了这里我们就要稍微升级一下我们的知识了。让我们来看看非方阵的几何意义。

正如我们之前所说,矩阵可看成线性变化。想象一个二乘二方阵,它的第一列是我们再熟悉不过的,第二列是。再想象一个一乘二非方阵,如果我们依然认为第一列 ,第二列是,这代表着什么?为什么和只剩下一个数字了?在什么情况下才会发生这种事?在一维空间。但你熟悉的,还在,所以不用害怕维度降低了,你的计算方法依然不变。

veUzyqe.jpg!web

上图右边的向量表示,在原先的坐标轴中,该向量是由4个,3个相加而成,那么现在把新的,再代入即可得出答案。

好的。在计算上,你完全能够理解向量与向量的点乘等价于矩阵与向量的乘法。那向量的点乘有什么几何意义呢?

想必你知道这个公式:

QvMNbai.png!web

它表示 向量点乘的几何意义是a向量的模(向量的长度,即|a|)乘以b向量的模在a向量方向上的投影(向量的投影,即|b|cosθ) ,替换a,b的位置这个句子也成立。那为啥点乘的几何意义是这样的?

除了上边你已经了解的——点乘跟矩阵乘向量是一样一样的,你只需再了解一个知识点就可融会贯通。那就是

我们引入一个一维数轴,该数轴与 同向,在这个数轴上有个单位向量 ,它的长度是1。

JVJvuum.jpg!web

当从二维空间的视角看时, ,坐标为(Ux,Uy)。从一维空间看,它的坐标是1。现在我对二维空间做线性变换,变到 所在的这条数轴上。来,告诉我,线性变换矩阵是什么?很好算吧,就是原向量在数轴上的投影,和原向量的投影。根据对称性,我们惊喜地发现竟然是矩阵[Ux Uy]!

也就是说! 矩阵[Ux Uy]这个线性变换就是把空间变换到了向量 所在的一维数轴上 。所以对于中的,它在变换后的位置,就是它在所在的这条数轴上的投影(|b|cosθ)。

让我们来总结一下。

1)从计算方式上,点乘等价于矩阵乘以向量

baieM3j.png!web

2)矩阵表示的线性变换,是将空间变换到向量所在的一维数轴上——[UxUy]表示的线性变换,是把空间降到了向量 所在的一维数轴上

3)矩阵乘以向量表示向量经线性变换后的新位置,也就是向量在数轴上的投影—— 的新位置即为

4) 在同一条数轴上,它们之间是倍数关系,可表示为 iiqaUzZ.jpg!web。所以

baUBZ3j.png!web

大功告成。

• 基向量变换

一直以来我们都用 这对基向量,但你的朋友谢广坤说我偏要用

这对基向量。虽然你觉得广坤很任性,但他这样其实完全没有毛病。

当你说的向量 不再是广坤的 ,广坤的 不再是你的 时,你们的友谊几乎走到了尽头。为了维护与广坤的友谊,你需要做基向量变换,也就是把广坤的表述的翻译过来,并且把你的翻译过去,这样你们才能继续交流。

让我们先翻译一下广坤。

这一天广坤说“我瞅着 EnEzMfQ.png!web这个向量充满了灵气。”显然,这不是你的坐标系中的 EnEzMfQ.png!web,你迫切地想知道广坤说的究竟是哪个。怎么办?

nqaiIvf.jpg!web

用跟之前一模一样的算法。你已经知道广坤喜欢的向量是 EnEzMfQ.png!web,也就是-1*广坤的,2*广坤的,那,广坤也早就告诉你了,是 ,所以代入就能知道广坤说的究竟是哪个向量了。

你经过计算得知广坤说的是 ,对此你不置可否,并且认为 URNvayu.jpg!web这个向量更胜一筹,于是你又需要把这个向量翻译给广坤。此前我们用广坤的向量左乘了线性变换矩阵,现在我们只需用我们的向量乘以线性变换矩阵的逆(逆矩阵的算法就请直接用计算机吧)。

现在你和广坤能够顺畅地交流向量了!

• 特征向量和特征值

特征向量就是在线性变换中方向保持不变的那些向量。特征值就是特征向量在变化后伸缩的程度。

muIRr2M.jpg!web

如上图,经过 jYbmmem.jpg!web的线性变换,粉线和绿线上的向量依然在原来的线上,它们就是特征向量。

特征值向量可能有无数个(比如空间只是拉伸了一下),也有可能没有(比如九十度旋转)。

简单的笔记就到此结束了,视频中的更多精彩内容,比如叉积的几何意义、你和广坤如何交流线性变换、特征向量转化为基向量等等并未展开。亲自去看一看视频吧!你绝不会失望的!

3Blue1Brown--Essence of linear algebra 系列视频

https://www.youtube.com/watch?v=fNk_zzaMoSs&list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab

封面图来自 3Blue1Brown

6JVj63n.jpg!web


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK