7、Ax=0,通解特解、自由列数字的神奇处、零空间的基、主元
说明:本文本系列是个人心得,学习MIT Gilbert Strang的线性代数之后心得,其目的并非传播,而是本人记载体会。本系列同时旨在理解联系线性代数和实际空间的感性认知。文笔之差,谢绝转载。
本文给出我对Ax=0,求通解、特解的两种计算方法。
最后详细描述通解、特解、自由列在线性变换中各自代表什么的感性认知。
解法1:
解法2:
说明:
Gilbert Strang给出的两种解法中,他的解法一是我草稿纸上的解法一,对于Gilbert Strang的第二种解法个人觉得太复杂了没有学习,而我的解法二使用本科讲的化到行最简形设特解求通解,稿纸的解法二那个特殊的符号是基础解系的意思。
我推荐我稿纸上的解法二,果断、直接、简单。
备注A:
假如有一种矩阵,如果x1出现的不是1,是4,那么为了找到主元列,即化简得到单位矩阵的样子,需要把x1=4除以4,得到单位1,即认为x1为一列主元列。
例如:
4 -1 -1
0 0 0
0 0 0
化简为
1 -1/4 -1/4
0 0 0
0 0 0
依此求得“基础解系”为:
1/4 1/4
1 0
0 1
但不出现分数,乘于4,
实际的基础解系为
1 1
4 0
0 4
这种情况常出现在第一列因为某些原因不是1的情况下。
修订:
(修订内容:主元和主元列的判定先决条件)
(日期:2018年8月8日)
(注:严谨得出)
在上面的备注A中,我错误的将主元列、主元、主元列的判断先决条件区分错误。
实际上,一个矩阵不需要化到行最简形矩阵再判断主元列和主元(纵然多此一举并不影响最终答案。),只需要将矩阵化到行阶梯形矩阵就可以,化到行阶梯形矩阵后,我们要观察的是线性相关和无关组,如上面矩阵,
一开始,就是行阶梯形矩阵了,而列2和列3是列1的线性相关,所以将列2和列3看作自由列,将列1看做主元列。
Gilbert Strang的解法二个人觉得很复杂,干脆不学这么复杂的东西:
(在9.1章我会提到这种类似的思想,但不会提到解法2,因为解法2就是为了明白这种思想,而这种思想直接讲述本质更容易明白,无需按在计算上麻烦自己。)
有兴趣解法2的可以看看其它两位同学的笔记
MIT线性代数课程精细笔记[第七课] (重点在讲Gilbert Strang的解法二)
麻省理工线性代数笔记(七)-Ax=0的求解 (重点在讲Gilbert Strang的解法一和基础思路)
补充一下本人对通解、特解、自由列在线性变换中各自代表什么的感性认知:
零空间包含的的正好是特解的线性组合。
我们很容易从解法二中观察到“特解”和“自由变量”的组合为向量形式的解。
我一直在思考为什么零空间会包含了特解和自由变量的线组,
以下是我个人的思考,可能并非没有错误,但方向应该是不会错的:
我们将矩阵化简,得到两种矩阵互相揉杂:1是最简的单位矩阵,2是自由列矩阵
互相揉杂的结果是A矩阵,
A矩阵是变换矩阵,
假如变换矩阵全都是单位矩阵,那么会如何,结果就是没有任何变换,
也就是变换的问题上出现在自由列矩阵上,
我们把目光集中研究自由列矩阵,
明确一下思路:造成Ax=0的原因在于A中的自由列矩阵。
也可以说:
1——之所有变换之后降维了,
2——之所以这个A矩阵有零空间,
3——之所以Ax是0的结果,
所有的原因都出现在A中的自由列矩阵上
自由列矩阵为
2 -2
0 2
我们从解法二的特解和标星号的齐次方程组和原方程组比较中得出,特解是标星号齐次方程组的系数,而特解的矩阵取其包含自由列的矩阵部分为:
-2 2
0 -2
取的是自由变量前的系数
这个系数是原方程组的系数即自由列矩阵的正负刚好相反的数字
也就是,
以上两个写出来的矩阵符号刚好相反
所以很显然了,
我的想法的结论是,
Ax=0
0是降维的结果
所以一定出现零空间
x就是零空间的一个向量
正是这个向量使得A变换后原向量空间的很多向量落在了新向量空间的零向量上
那么我们求通解x=【x1、x2、x3、x4】T的 意义和目的就是求这个原向量空间里的“不幸向量”
(这个不幸向量经过A落在A构成的新向量空间的零向量上,即结果等于0)
而求特解的目的和意义是:造成不幸向量出现的原因是——就是“特解的正负相反数”在变换矩阵A中的出现。而特解是“不幸向量x”的组成的一部分的原因,
不幸向量被组成的完整原因是:n个向量空间里特殊解特殊向量的出现使得构成了不幸向量,
自由变量是什么,自由变量是特解的倍数,在上一章6的零空间概念中,就是紫色线的倍数,几乎我们就可以认为特解特殊向量是一个基础的“基”(当然不是向量空间基的意思),而自由向量是这个基础的“基”的倍数,这种理解等同于1是所有实数的“基”,其它实数都是1的倍数。
所以回归到刚才的某一句话:
“特解的正负相反数”在变换矩阵A中的出现。
总结一下:
不幸向量x出现的原因,是因为变换矩阵A中的出现了“特解的正负相反数”。
也就是变换矩阵A出现了自由列的几个数字使得这几个数字出现神奇般的魔力,
它们让:
某一部分向量经过变换出现了零向量,
它们让:
某一部分向量经过变换出现了向量空间维度上的降维,
它们让:
向量空间A出现有了零空间这种奇怪的BUG,其中一个为 x
所谓
求通解就是求零空间里的这个经过数字魔力后的“不幸向量”
所谓
求特解就是求不幸向量的原因在A变换矩阵中的体现是什么,而也正因为这个体现的倍数关系让特解的倍数组成了通解。
(注:我讲述的特解是分离了单位矩阵下研究的自由矩阵的某组向量,不过实际的特解是自由矩阵和单位矩阵的结合研究下的某组向量,只不过因为单位矩阵并不影响我们的研究结果,也就是你可以不用纠结特解在研究中是分离单位矩阵的还是不用分离单位矩阵,两者结果都一样。)
(另注:注意从整体去看待A矩阵的时候,分离出“自由列矩阵”,就会发现“自由列矩阵”其实就是诸多结果的影响因素的矩阵。)
特解和基的关系:
根据我们上面的一轮推论之后,我们再仔细观察特解,似乎是由两个列向量组成的(其实在本文中的方程才是两个列向量),观察通解的结果x=c1*特1+c2*特2和v=?i+??j的结构相像,我们直觉里有个大胆的推论:特解矩阵和自由变量的线性关系 和 一个向量空间中的基的线性关系可能存在关系,进一步的结论是什么,我们先推推看:
假如有通解为:
显然:
特解1为
-2
1
0
0
特解2为
2
0
-2
1
那么影响的整体在于:
特解矩阵:
-2 2
1 0
0 -2
0 1
一个4*2的矩阵
先记住这个结果。
然后看通解:
x=c1*特解1+c2*特解2
不难想象其实是这样子的
4行2列的特解矩阵 * [c1,c2]T , 得到的就是:x=c1*特解1+c2*特解2 ,见下图:
这就是基础的线性组合啊:" v=? i + ?? j "
可见,特解1和2就是i和j,
?和??再次回证了c1和c2其实是“倍数关系”,
再明白点就是:特解就是向量空间的基
这个特解的线性组合 组成了零空间中的其中一个向量x,
综上总结: 特解也就是零空间的基向量!
再补充一点:
这是一个只有i、j作为基向量的向量空间,也就是二维的向量空间,
而描述这个向量的具体坐标元素竟达到4个(4行代表:x、y,z、u),也就是它是一个在4维空间中的2维向量子空间。
(完)
感慨一下,原本我是没有发现这么有意思的东西的,匆匆一瞥了稿纸上写的一句话零空间包含特解和自由变量的组合这个只是单纯从计算上的结论,一直匪夷所思...零空间怎么和特解通解有关了?特解通解不是计算上定义的吗,怎么和零空间降维这种抽象立体变换有关了,一时没想明白,仔细看了计算的过程发现了“影响点”
我非常感慨这个“影响点”发现,
从前我一直自己研究理论和线代变换的本质并不清楚具体有什么用处,
现在如果在工作和计算中,让我去发现去调整某种参数,
我估计速度就像仔细看计算过程时,直觉秒看出这个“影响点”那么快速那么神奇,
这真的不是视频有教我的,也教不来,得益于往常思考本质的时间。
数字真的是神奇的。
《7、求解Ax=0,通解、特解、自由列数字的神奇之处、零空间的基》(完)