2025-10-13

Linear Algebra Done Right

Linear Algebra Done Right

记录大致讲了什么

Book Edition 3

向量空间

我们定义向量空间

向量空间

向量空间定义在域FF上,要求支持:

  • 加法
  • FF中数的数乘
  • 加法单位元(0元)
  • 加法逆元
  • 加法交换结合
  • 数乘结合
  • 加法对数乘分配
  • 对加法和数乘封闭

加粗部分用于判断子空间,根据FF区分是否是实向量空间/复向量空间

子空间

就是子集且是向量空间的对吧

判定可以看上面

维数

向量空间还应该有维数.于是定义

线性无关组

Groupv1vnVis linear independet    {cn},ciF,i=1ncivi=0    i,ci=0\text{Group} v_1\ldots v_n \in V \text{is linear independet} \iff \\ \forall \{ c_n \} ,c_i \in F, \\ \sum _{i = 1} ^{n} c_iv_i = 0 \iff \forall i,c_i=0

张成,张成组

span(v1vn)={i=1ncivi}\begin{gathered} \operatorname{span}( v_1 \ldots v_n ) = \{ \sum _{i = 1} ^{n} c_iv_i \} \end{gathered}

张成VV的组简称张成组

基=张成组 且 线性无关组

则按照直觉的,维数应该是张成组长度的最小值,线性无关组长度的最大值,基的长度等等,下面讨论的是有限维线性空间.

  • dimV\dim V是张成组最小长度
  • dimV\dim V是线性无关组组最大长度
  • dimV\dim V是任意一组基的长度

首先说明,对一个线性相关的组,我们一定可以去掉一个线性相关项保持张成空间不变(显然).

首先说明

任意一组线性无关组长度小于等于任意一组张成组长度:

Sol1

考虑一个线性无关组和一个张成组,将一个线性无关组的元素加入张成组,则形成的一定是线性相关组,删去一个张成组中的元素则保持张成,不断重复这个操作,注意因为被加入的线性无关,所以你想相关一定得带张成组中的,于是可以一直操作.

直到线性无关组全部被加入,则因为每次删掉一个张成组元素,你一定有线性无关组长度不大于它.

Sol2

另一个是更常见的证法吧,就是直接用张成组去表示线性无关组的每个向量,列方程线性无关组的某个线性组合和为00.

然后发现你列出的方程个数(张成组长度)若小于未知数个数(线性无关组长度),那么必有非零解,就证毕.

线性无关组可通过加元素扩展到基,张成组可通过删除元素到基

对线性无关组,每次加入一个不属于张成空间的,由于组的长度大小不断增加,而存在一个长度的基,所以你的过程会停止.

同理对张成组每次删掉一个线性相关项不影响张成空间.

每组基的长度都相当,具有恰当长度的线性无关组/张成组是基.

第一句用小于等于关系,后面两个通过基的长度相等+上一条可以变成基说明.

维数

维数就是这个长度为 dimV\dim V

空间的运算

空间的和

U+V={u+vuU,vV}\begin{gathered} U+V = \{ u+v \vert u\in U,v\in V \} \end{gathered}

加法实际上是并(包含子空间所有向量的最小空间).

并定义直和.

空间直和

W=UV=U+Vs.t.wW,!uU,vV,u+v=w\begin{gathered} W = U\oplus V = U + V \\ s.t.\\ \forall w \in W, \exists! u\in U,v\in V, u+v=w \end{gathered}

直和相当于不交并,是对空间进行一种分解.

然后直和的判定容易证明只要00的表示满足唯一性,并推出当且仅当它们的交只有00

空间的积

就是笛卡尔积.

U×V={(u,v)uU,vV}\begin{gathered} U\times V=\{ (u,v) \vert u\in U,v\in V \} \end{gathered}

其实也可以先扩展一下直和 是等价的.

仿射空间

u+V={u+vu+V}(u+V)+(w+V)=(u+w)+Vλ(u+V)=λu+V\begin{gathered} u+V=\{ u+v \vert u+V \} \\ (u+V)+(w+V)=(u+w) + V \\ \lambda (u+V) = \lambda u + V \end{gathered}

注意如果uVu\in V则不变,u∉Vu\not\in V则是一个没有00的空间,在此空间的线性组合变成了i=0ncivi s.t. i=0nci=1\sum _{i = 0} ^{n} c_iv_i\ s.t.\ \sum_{i=0}^n c_i=1.

然后仿射空间关于以上运算是线性空间,其中0=V0=V

空间的商

U/V={u+VuU}\begin{gathered} U/V={\left\{ u+V \vert u\in U \right\}} \end{gathered}

可以理解成等价类分类.如果两个向量的差在VV中则认为他们等价.新的空间中每个元素都是一个等价类.而你仿射空间的变换也可以看成是对代表元做变换.

最后考虑它们的维数,有:

dimU×V=dimUV=dimU+dimVdimU+V=dimU+dimVdimUVdimU/V=dimUdimV\begin{gathered} \dim U\times V=\dim U\oplus V=\dim U+\dim V \\ \dim U+V = \dim U+\dim V-\dim U\cap V \\ \dim U/V=\dim U-\dim V \end{gathered}

第一行是显然的.

第二行考虑取UVU\cup V的一组基,再其中添加上UVU-V的基和VUV-U的基.

第三行需要线性映射.

线性映射

线性映射基本性质

线性映射

线性映射是映射满足:

  • 齐性: λv=λTv\lambda v=\lambda Tv
  • 加性: T(u+v)=Tu+TvT(u+v)=Tu+Tv

线性变换的运算

(S+T)u=Su+Tu(λT)u=λ(Tu)(ST)u=S(T(u))\begin{gathered} (S+T)u=Su+Tu \\ (\lambda T)u=\lambda (Tu) \\ (ST)u=S(T(u)) \end{gathered}

符合直觉的.于是你可以说明L(U,V)\mathcal{L}(U,V)(由T:UVT:U\to V组成的集合)是 dimU×dimV\dim U\times \dim V维的线性空间,他的标准基可以是所有把UU的一个基映到VV的一个基的映射.

值域,零空间

for linear map T:UVrangeT={vv=Tu,uU}nullT={uTu=0,uU}\begin{gathered} \text{for linear map } T:U\to V \\ \operatorname{range} T = \{ v \vert v=Tu,u\in U \} \\ \operatorname{null} T = \{ u \vert Tu=0,u \in U \} \end{gathered}
dimU=dimnullT+dimrangeT\begin{gathered} \dim U=\dim \operatorname{null} T+\dim \operatorname{range} T \end{gathered}

考虑 nullT\operatorname{null} T 的基u1unu_1\ldots u_n,并添加v1vmv_1\ldots v_m扩充到UU的基.

考虑Tv1TvmTv_1\ldots Tv_m若线性相关,i=1mciTvi=0    Ti=1mcivi=0\sum _{i = 1} ^{m} c_iTv_i=0 \implies T\sum _{i = 1} ^{m} c_iv_i=0,则 w=i=1mcivinullT,w=i=1mcivi=i=1ndiuiw=\sum _{i = 1} ^{m} c_iv_i\in \operatorname{null} T,w=\sum _{i = 1} ^{m} c_iv_i=\sum _{i = 1} ^{n} d_iu_i,与ui,viu_i,v_i构成一组基矛盾.

于是TviTv_i线性无关,且容易注意到任意wU,Tw=i=1nciTui+i=1mdiTvi=i=1mdiTvispan(Tv1TVm)w\in U,Tw=\sum_{i=1}^n c_iTu_i+\sum_{i=1}^m d_iTv_i=\sum_{i=1}^md_iTv_i\in \operatorname{span} (Tv_1\ldots TV_m)故得证.

单射,满射,双射,可逆

  • 单射:TxTy    xyTx\ne Ty \implies x\ne y
  • 满射: vV,uU,Tu=v\forall v\in V,\exists u\in U, Tu=v
  • 双射就是同时有两条
  • 对于双射TT的定义T1T^{-1}满足TT1=T1T=ITT^{-1}=T^{-1}T=I

基本性质

  1. 单射等价于只把00映射到00.
  2. 存在UVU\to V单射说明 dimUdimV\dim U\le \dim V.
  3. UVU\to V有单射说明VUV\to U有满射.
  4. UVU \to V存在双射称为U,VU,V同构,可以证明任意向量空间同构于某个FnF^n.

都挺显然的.

dimU/V=dimUdimV\begin{gathered} \dim U/V=\dim U-\dim V \end{gathered}

定义 TL(U,U/V)T\in \mathcal{L}( U , U/V ) 为商变换,把uu映射到u+Vu+V.

nullT=VrangeT=U/V\begin{gathered} \operatorname{null} T=V \\ \operatorname{range} T=U/V \end{gathered}

套用上面值域和零空间的维数公式即可.

线性映射的矩阵

矩阵

选取U,VU,V分别一组基u1umu_1\ldots u_m,v1vnv_1\ldots v_n,可以把线性变换TT写成n×mn\times m的矩阵M(T,u1um,v1vn)=An×m\mathcal{M}(T,u_1\ldots u_m,v_1\ldots v_n)=A_{n\times m}满足

Tui=j=1nAj,ivj\begin{gathered} Tu_i=\sum_{j=1}^n A_{j,i}v_j \end{gathered}

即每一列是一个基向量在像空间中的基的表示.然后有的时候也直接简写M(T)\mathcal M(T).

矩阵可以这么定义因为线性变换的线性保证了你可以只用基的变换去描述它,同时基的这种变换也能唯一确定线性变换.

于是可以定义矩阵运算:

M(S)M(T)=M(ST)M(S)+M(T)=M(ST)λM(T)=M(λT)\begin{gathered} \mathcal M( S ) \mathcal M( T ) = \mathcal M( ST ) \\ \mathcal M( S ) + \mathcal M( T ) = \mathcal M( ST ) \\ \mathcal \lambda\mathcal M( T ) = \mathcal M( \lambda T ) \end{gathered}

其中第一行矩阵乘法用坐标写一下可以推出经典的矩阵乘法方式.

算子,不变子空间,商算子和限制算子

这些概念会在本征值那里用到 但从属性上讲和这里线性映射关系更大.

算子

TL(V,V)\begin{gathered} T\in \mathcal L( V , V ) \end{gathered}

即映射到自身空间的线性变换.

不变子空间

即对算子TT,有uU,TuU\forall u\in U, Tu\in U,则UU为不变子空间.

商算子,限制算子

T/UL(V/U,V/U),(T/U)(v+U)=(Tv+U)TUL(U,U),TUv=Tv\begin{gathered} T_{/U}\in \mathcal L( V/U , V/U ),(T_{/U})(v+U)=(Tv+U) \\ T\vert_U \in \mathcal L( U , U ), T\vert_U v=Tv \end{gathered}

显然TUT\vert_U要求了UU是不变子空间.

把算子放到更小的空间去研究的方式.

p(x)P    rangep(T),nullp(T) is invariant for T\begin{gathered} p(x)\in \mathcal{P} \\ \implies \operatorname{range} p(T),\operatorname{null} p(T)\text{ is invariant for } T \end{gathered}
urangep(T)    v,p(T)v=uTu=Tp(T)v=p(T)Tvrangep(T)unullp(T)    p(T)u=0p(T)Tu=Tp(T)u=T0=0\begin{gathered} u\in \operatorname{range} p(T) \\ \implies \exists v,p(T)v=u \\ Tu=Tp(T)v=p(T)Tv\in \operatorname{range} p(T) \\ u\in \operatorname{null} p(T) \\ \implies p(T)u=0 \\ p(T)Tu=Tp(T)u=T0=0 \end{gathered}

对偶

线性泛函,对偶空间

线性泛函就是fL(V,F)f \in \mathcal L( V , F ),所有这样的ff组成线线性空间VV'VV的对偶空间.

线性泛函可以看成是向量/点的对偶.线性泛函 {φφiej=[i=j]}\{ \varphi \vert \varphi_i e_j=[i=j] \}构成对偶空间的基.

对偶映射

TL(U,V)T\in\mathcal L( U , V ) ,定义 TL(V,U)T'\in \mathcal L( V' , U' ) 满足

fV,Tf=fT\begin{gathered} \forall f \in V',T'f=fT \end{gathered}

TT'是反的可以理解因为VV'的泛函的输入才是TT的输出.导致没法根据这几个东西定义一个正的出来.

然后对偶主要解释了:M(T)=M(T)T\mathcal M( T' ) =\mathcal M( T )^{T}(右上角的TT是转置的意思).

对偶映射的运算

(ST)=TS(S+T)=S+T(λS)=λS\begin{gathered} (ST)'=T'S' \\ (S+T)'=S'+T' \\ (\lambda S)'=\lambda S' \end{gathered}
(ST)f=fST=T(fS)=T(Sf)(S+T)f=f(S+T)=fS+fT=Sf+Tf(λS)f=fλS=λfS=Sf\begin{gathered} (ST)'f=fST=T'(fS)=T'(S'f) \\ (S+T)'f=f(S+T)=fS+fT=S'f+T'f \\ (\lambda S)'f=f\lambda S=\lambda fS=S'f \\ \end{gathered}

零化子

对线性空间VV来说,子空间UU的零化子 U0={ffV,uU,fu=0}U^0=\{ f \vert f\in V',\forall u\in U,fu=0 \}.

注意U0U^0同时依赖UUVV.

dimU+dimU0=dimV\begin{gathered} \dim U+\dim U^0=\dim V \end{gathered}

UU的基u1unu_1\ldots u_n扩充到VV的基u1un,un+1un+mu_1\ldots u_n,u_{n+1}\ldots u_{n+m}.并取VV'的标准基φiuj=[i=j]\varphi_i u_j =[i=j],则显然fU0f\in U^0要求ff不能有φi,i<n\varphi_i,i<n的分量,而任意i>ni>n的分量都可以有.于是得证.

nullT=(rangeT)0rangeT=(nullT)0\begin{gathered} \operatorname{null} T'=(\operatorname{range} T)^0 \\ \operatorname{range} T'=(\operatorname{null} T)^0 \end{gathered}

考虑Tfu=fTu=0T'fu=fTu=0关于所有uu成立,则ff的范围是什么.看右侧显然是 (rangeT)0(\operatorname{range} T)^0 看左侧则是 (nullT)0(\operatorname{null} T')^0.于是得证.

对第二行,左边是任意Tg=gTT'g=gT,右边说你这个线性泛函把所有Tu=0Tu=0的映到00,恰好是左边的gTgT满足条件.于是得证.

然后还有一个问题是我们以为T=TT''=T,但实际上你甚至不能保证VVVV''是相同的.然后有个典范同构的概念形容他俩的关系就是存在一种不依赖于基的选取的同构(只要定义T(u)f=fuT(u)f=fu,则uuT(u)T(u)是双射.)

本征值基础

本征值

本征值,本征向量

若对算子TT,v0V,λF s.t. Tv=λv\exists v\ne 0\in V,\lambda\in F\ s.t.\ Tv=\lambda v,则λ,v\lambda,v分别为本征值,本征向量.

就是说算子在这个方向上对变换只有伸缩.

一个本征值可能对应多个线性不相关的本征向量,它们构成本征空间E(λ,T)E(\lambda,T)

λ\lambdaTT的本征值等价于 TλIT-\lambda I不是双射,或不是单射/满射

首先注意到对算子来说 单射,满射双射等价

又因为单射等价于 nullT=0\operatorname{null} T=0 所以 (TλI)v=0(T-\lambda I)v=0 和它不是单射等价.

不同本征值对应对本征向量线性不相关.

反证,你要利用不同本征值这个性质,于是你设 vnspan(v1vn1)v_n \in \operatorname{span}( v_1\ldots v_{n-1} )nn为满足条件对最小的.

vn=i=1n1civiTvn=i=1n1Tciviλn(i=1n1civi)=i=1n1λicivi0=i=1n1(λiλn)civi\begin{gathered} v_n=\sum _{i = 1} ^{n-1} c_iv_i \\ Tv_n=\sum _{i = 1} ^{n-1} Tc_iv_i \\ \lambda_n (\sum _{i = 1} ^{n-1} c_iv_i)=\sum _{i = 1} ^{n-1} \lambda_i c_iv_i \\ 0=\sum _{i = 1} ^{n-1} (\lambda_i-\lambda_n) c_iv_i \end{gathered}

因为nn是最小的,所以v1vn1v_1\ldots v_{n-1}线性无关,然后你就推出矛盾.

有此容易说明本征值个数不大于线性空间维数.

复向量空间中的线性映射一定有本征值

考虑

vV,dimV=nv,Tv,T2vTnV is dependenti=0nciTiv=0代数基本定理(i=1n(TλiI))v=0    i,TλiI=0    λiis a eigenvalue of T\begin{gathered} v\in V,\dim V=n \\ v,Tv,T^2v\ldots T^{n}V \text{ is dependent} \\ \sum _{i = 0} ^{n} c_iT^iv =0 \\ \stackrel{\text{代数基本定理}}{\Longrightarrow} (\prod _{i = 1} ^{n} (T-\lambda_i I))v=0 \implies \exists i,T-\lambda_i I=0 \\ \implies \lambda_i \text{is a eigenvalue of } T \\ \end{gathered}

上三角矩阵

按照上面基的理解,有

M(T,u1un)is upper triangular matrix    i,Tuispan(u1ui)    i,span(u1ui)is invariant space\begin{gathered} \mathcal M( T,u_1\ldots u_n ) \text{is upper triangular matrix} \\ \iff \forall i, Tu_i\in \operatorname{span}( u_1\ldots u_i ) \\ \iff \forall i, \operatorname{span}( u_1\ldots u_i ) \text{is invariant space} \end{gathered}

感觉是显然的.

那么考虑什么样的线性映射TT有一组基u1unu_1\ldots u_n有上三角矩阵An×nA_{n\times n}.

TL(V,V),V is complex vector space    u1un,M(T,u1un) is upper triangular matrix\begin{gathered} \forall T\in \mathcal L( V , V ), V \text{ is complex vector space} \\ \implies \exists u_1\ldots u_n,\mathcal M( T,u_1\ldots u_n ) \text{ is upper triangular matrix} \end{gathered}

Proof 1

归纳,假设对任意维数小于dimV\dim V的空间成立,考虑取TT的任意本征值λ\lambda,则 U:=rangeTλIU:=\operatorname{range} T-\lambda I,则因为TT不是单的所以 dimU<dimV\dim U<\dim V.且 uU,Tu=(TλI)u+λuU\forall u \in U,Tu=(T-\lambda I)u+\lambda u\in U,所以TTUU不变.

于是可以应用归纳结假设,TUT\vert_UUU上有一组基u1unu_1\ldots u_n使得 M(TU,u1un)\mathcal M( T\vert_U,u_1\ldots u_n ) 是上三角矩阵.

将这组基扩展到VV上成为u1un,v1vmu_1\ldots u_n,v_1\ldots v_m,则对i\forall i,Tvi=(TλI)vi+λvispan(u1un)+span(vi)span(u1un,v1vi)Tv_i=(T-\lambda I)v_i+\lambda v_i\in \operatorname{span}( u_1\ldots u_n ) +\operatorname{span}( v_i )\subset \operatorname{span}( u_1\ldots u_n,v_1\ldots v_i ),于是是上三角矩阵.

Proof 2

同样归纳,取任意本征向量 u,U:=span(u)u,U:=\operatorname{span}( u ),考虑T/UT_{/U}是维数为 dimV1\dim V-1 的空间V/UV/U上算子.则它有上三角矩阵.于是存在v1+Uvn+Uv_1+U\ldots v_n+U,使得 v+UV/U,T/U(v+U)span(v1+U,,vn+U)\forall v+U\in V/U,T_{/U}(v+U)\in \operatorname{span}( v_1+U,\ldots,v_n+U ),也就有Tvspan(v1,,vn)Tv\in \operatorname{span}( v_1,\ldots,v_n ).

然后现在把v1vn,uv_1\ldots v_n,u作为新的基,容易发现 Tu=λuspan(v1,,vn,u)Tu=\lambda u\in \operatorname{span}( v_1,\ldots,v_n,u )满足条件.于是存在上三角矩阵.

都要从维度归纳,第二个自然一点吧:商空间就是抹去若干维度.

[think] 但是第一个从TλIT-\lambda I的值域出发是什么个意思?主要利用两个性质:是不变子空间,以及Tv=(TλI)v+λvTv=(T-\lambda I)v+\lambda v.是不是相当于把其他向量也拆的"像"本征向量了.

upd:第一个思路我们其实也是抹去特征向量所在的维度,而对其他向量TλIT-\lambda I是双射,所以可以还原.

TT有逆等价于TT的上三角矩阵对角线全部非00

先假设矩阵有逆,设空间VV基为v1vnv_1\ldots v_n.

Tv1=A1,1v1    A1,10Tvk=u+Ak,kvk,uspan(v1vk1)if Ak,k=0Tvkspan(v1vk1)v1vk1 is independent Tv1Tvk1 is independent, so it is a baseTvkspan(Tv1Tvk1)c s.t. i=1kciTvi=0T1i=1kcivi=0contradiction!\begin{gathered} Tv_1=A_{1,1}v_1 \implies A_{1,1}\ne 0 \\ Tv_k=u+A_{k,k}v_k,u\in \operatorname{span}( v_1\ldots v_{k-1} ) \\ \text{if } A_{k,k}= 0 \\ Tv_k\in \operatorname{span}( v_1\ldots v_{k-1} ) \\ \because v_1\ldots v_{k-1} \text{ is independent } \\ \therefore Tv_1\ldots Tv_{k-1} \text{ is independent, so it is a base} \\ \therefore Tv_k \in \operatorname{span}( Tv_1\ldots Tv_{k-1} ) \\ \exists c \ s.t.\ \sum _{i = 1} ^{k} c_iTv_i=0 \\ \stackrel{T^{-1}}{\Longrightarrow}\sum _{i = 1} ^{k} c_iv_i=0 \\ \text{contradiction!} \end{gathered}

再假设TT关于VV的基v1vnv_1\ldots v_n的矩阵为上三角矩阵且对角线元素非00.

那么我们知道Tvi=Ai,ivi+j=1i1cjTvj1Tv_i=A_{i,i}v_i+\sum_{j=1}^{i-1}c_jTv_{j-1},其中后一项属于 span(v1vi1)\operatorname{span}( v_1\ldots v_{i-1} ),于是容易发现Tv1TvnTv_1\ldots Tv_n线性独立,是一组基,于是TT是满的,于是TT可逆.

TT的某个基下的上三角矩阵对角线元素是TT的本征值.

考虑(TλI)v=0(T-\lambda I)v=0,则λ\lambda是本征值等价于TλIT-\lambda I不是单的,也就不是可逆的,即用上面条件对角线存在00,即λ\lambda等于对角线上的某个元素.

对角矩阵

本征空间

E(λ,T)=nullTλI\begin{gathered} E(\lambda,T)=\operatorname{null} T-\lambda I \end{gathered}

TT在基v1vnv_1\ldots v_n下为对角矩阵等价于

  • v1vnv_1\ldots v_nTTnn个本征向量.
  • iE(λi,T)=V\oplus_i E(\lambda_i,T)=V
  • 存在nn个一维不变子空间直和为VV

这个感觉也是显然的.

内积空间

内积

内积

二元函数<x,y>:(V,VFV,V\to F)满足:

  • 正性: <v,v>0<v,v>\ge 0
  • 定性: <v,v>=0    v=0<v,v>=0 \iff v=0
  • 第二个位置的线性:<u,v><u,v>关于vv是线性的
  • 共轭对称性:<u,v>=<v,u><u,v>=\overline{<v,u>}
  • 内积<u,v><u,v>关于uu也是线性的.
  • <u,0>=<0,u>=0<u,0>=<0,u>=0

第一条用共轭对称性换到后面再换回来:

a<u1,v>+b<u2,v>=a<v,u1>+b<v,u2>=<v,au1+bu2>=<au1+bu2,v>\begin{gathered} a<u_1,v>+b<u_2,v>=a \overline{ <v,u_1> } +b \overline{ <v,u_2> } \\ =\overline{ <v,au_1+bu_2> } \\ =<au_1+bu_2,v> \end{gathered}

第二条考虑线性映射00映到00.

范数

v=<v,v>\vert\vert v \vert\vert = \sqrt{<v,v>}定义为向量的范数.

也可以用范数定义内积.

对实向量空间:

<u,v>=u+v2uv24\begin{gathered} <u,v>=\dfrac{\vert\vert u+v \vert\vert ^2-\vert\vert u-v \vert\vert ^2}{4} \end{gathered}

对复向量空间:

<u,v>=u+v2uv24+u+iv2uiv24i\begin{gathered} <u,v>=\dfrac{\vert\vert u+v \vert\vert ^2-\vert\vert u-v \vert\vert ^2}{4} + \dfrac{\vert\vert u+iv \vert\vert ^2-\vert\vert u-iv \vert\vert ^2}{4}i \end{gathered}

拆开验算显然是对的.

正交

uv    <u,v>=0u\perp v \iff <u,v>=0

正交分解

u,v,v=uu2<u,v>+(vuu2<u,v>)\forall u,v,v=\dfrac{u}{\vert\vert u \vert\vert^2 } <u,v>+(v-\dfrac{u}{\vert\vert u \vert\vert^2 } <u,v>)

<u,v>  uv<u,v> {\ } \le {\ } \vert\vert u \vert\vert \vert\vert v \vert\vert

letw=uu2<u,v>v=w+(vw),wvw    v2=w2+(vw)2w2=<u,v>2u2\begin{gathered} \text{let} w=\dfrac{u}{\vert\vert u \vert\vert^2 }<u,v>\\ v=w+(v-w),w\perp v-w \\ \implies v^2=w^2+(v-w)^2\le w^2=\dfrac{<u,v>^2}{\vert\vert u \vert\vert ^2} \end{gathered}

正交基

正交基,规范正交基.

正交基是两两正交的基.规范正交基就是两两正交且范数均为11的基.

格拉姆施密特过程

任意给定一组基u1unu_1\ldots u_n,可以构造规范正交基e1ene_1\ldots e_n.

vi=uij=1i1<ui,ej>ejei=vivi\begin{gathered} v_i=u_i-\sum_{j=1}^{i-1}<u_i,e_j>e_j \\ e_i=\dfrac{v_i}{\vert\vert v_i \vert\vert } \end{gathered}

其实构造是很好想的,就是对于前i1i-1个正交基的空间,把第ii个去掉所有和某个基方向相同的分量,剩下的就是新的正交方向.

TT关于VV上一组基v1vnv_1\ldots v_n由上三角矩阵,则TT关于VV上一组规范正交基有上三角矩阵.

任意复向量空间上算子关于某个规范正交基有上三角矩阵.

考虑刚才的构建过程里,每个 span(u1ui)\operatorname{span}( u_1\ldots u_i )都没有改变,所以是显然的.

而第二条可以由 复向量空间上算子关于某基有上三角矩阵 和 第一条显然推出.

单列第二条是因为它叫 舒尔定理.

里斯表示定理

对任意线性泛函ff存在uu使得fv=<u,v>fv=<u,v>

e1ene_1\ldots e_n是一组规范正交基,则

fv=fi=1n<v,ei>ei=i=1n<v,ei>fei=i=1n<v,feiei>=<v,i=1neifei>\begin{gathered} fv=f\sum _{i = 1} ^{n} <v,e_i> e_i \\ =\sum _{i = 1} ^{n} <v,e_i> fe_i \\ =\sum _{i = 1} ^{n} <v,fe_i\cdot e_i> \\ =<v,\sum _{i = 1} ^{n} e_ife_i> \end{gathered}

正交补

正交补

U={v<u,v>=0,uU,vV}U^{\perp}=\{ v \vert <u,v>=0,u\in U,v\in V \}

UU中向量正交的向量们.

  • UU=VU\oplus U^{\perp}=V
  • (U)=U(U^{\perp})^{\perp}=U

UU的一组规范正交基u1unu_1\ldots u_n,扩充到VV的一组规范正交基u1un,v1vmu_1\ldots u_n,v_1\ldots v_m.

则容易发现 U=span(v1vm)U^{\perp}=\operatorname{span}( v_1\ldots v_m ).

然后第一条是显然的.第二条的话你把UU^{\perp}的基扩充到VV的时候扩充u1unu_1\ldots u_n就也是显然的.

正交投影

let u=w1+w2,w1U,w2U    PU=w1\begin{gathered} \text{let } u=w_1+w_2,w_1\in U,w_2\in U^{\perp} \\ \implies P_U=w_1 \end{gathered}

即干掉垂直分量,投影到UU所在超平面上.

  • PUP_U 是线性变换.
  • UU的一组规范正交基e1eme_1\ldots e_m,有PUv=i=1m<v,ei>eiP_Uv=\sum_{i=1}^m <v,e_i> e_i

以及一些很显然的性质.

第二条看起来很显然.那么有了第二条第一条也很显然.

uU,uvPUvv\forall u\in U,\vert\vert u-v \vert\vert \ge \vert\vert P_Uv-v \vert\vert

分解! v=v1+v2,v1U,v2Uv=v_1+v_2,v_1\in U,v_2\in U^\perp.

uv1v22=(uv1)2+v22\begin{gathered} \vert\vert u-v_1-v_2 \vert\vert^2 =(u-v_1)^2+v_2^2 \end{gathered}

于是显然取u=v1u=v_1最小,即证.

伴随,自伴算子,正规算子.

伴随

伴随

对于算子TT,若u,v\forall u,v,<Tu,v>=<u,Tv><Tu,v>=<u,T^*v>,则TT^*TT的伴随.

  • (S+T)=S+T(S+T)^*=S^*+T^*
  • (λT)=λT(\lambda T)^*=\lambda T^*
  • (ST)=TS(ST)^*=T^*S^*
  • (T)=T(T^*)^*=T
  • nullT=(rangeT)\operatorname{null} T^*=(\operatorname{range} T)^{\perp}

前三个用定义带进去即可.

第四个,<u,(T)v>=<Tu,v>=<v,Tu>=<Tv,u>=<u,Tv><u,(T^*)^*v>=<T^*u,v>=\overline{<v,T^*u>}=\overline{<Tv,u>}=<u,Tv>

第五个,考虑是右边对任意uu,<Tu,w>=0<Tu,w>=0的所有ww,<Tu,w>=<u,Tw><Tu,w>=<u,T^*w>,故 wnullTw\in \operatorname{null} T^*

M(T,v1vm,u1un)=M(T,u1un,v1vm)T(v1vm),(u1un) are regular orthogonal bases\begin{gathered} \mathcal M( T^*, v_1\ldots v_m, u_1\ldots u_n) = \overline{ \mathcal M( T ,u_1\ldots u_n,v_1\ldots v_m)^T } \\ (v_1\ldots v_m),(u_1\ldots u_n) \text{ are regular orthogonal bases} \end{gathered}

右边说的是转置再把每一项共轭.

<Tu,v>=<u,Tv>Tu=i=1mj=1nAj,i<u,ui>vj<Tu,v>=<i=1mj=1nAj,i<u,ui>vj,v>=i=1mj=1nAj,i<u,ui><vj,v>=<u,i=1mj=1nAj,i<vj,v>ui>=<u,Tv>\begin{gathered} <Tu,v>=<u,T^*v> \\ Tu=\sum _{i = 1} ^{m} \sum_{j=1}^n A_{j,i}<u,u_i>v_j \\ <Tu,v> \\ = <\sum _{i = 1} ^{m}\sum_{j=1}^n A_{j,i}<u,u_i>v_j,v> \\ =\sum _{i = 1} ^{m} \sum_{j=1}^n A_{j,i}<u,u_i><v_j,v> \\ =<u,\sum _{i = 1} ^{m} \sum_{j=1}^n A_{j,i}<v_j,v>u_i> \\ =<u,Tv> \end{gathered}

其实就是直接用规范正交基写开直接做.

自伴算子

自伴算子

T=TT=T^*

所以这个实空间下就是我们实对称矩阵啊.

T=T    T’s eigenvaluesRT=T    v,<v,Tv>RT=T    (<v,Tv>=0    T=0)\begin{gathered} T=T^* \implies T\text{'s eigenvalues}\in R \\ T=T^* \iff \forall v,<v,Tv> \in R \\ T=T^* \iff (<v,Tv>=0 \implies T=0) \end{gathered}

注意,前两条对复向量空间成立,最后一条是对实向量空间成立.

所以说书说伴随类比共轭,自伴算子类比实数啊.

第一行,根据舒尔定理,TT有关于规范正交基的上三角矩阵,然后因为矩阵等于共轭转置,于是对角线上对应相等,于是都是实数.

第二行,<v,Tv>=<Tv,v>=<v,Tv>=<v,Tv><v,Tv>=\overline{ <Tv,v> } = \overline{ <v,T^*v> } =\overline{ <v,Tv> }可以正推.

反推的话

v,0=<v,Tv><v,Tv>=<v,Tv><v,Tv>=<v,(TT)v>=0\begin{gathered} \forall v,0 \\ =<v,Tv>-\overline{ <v,Tv> } \\ =<v,Tv>-<v,T^*v> \\ =<v,(T-T^*)v>=0 \end{gathered}

这里我们似乎需要点引理:

复向量空间下,只有T=0T=0可以保证v,<v,Tv>=0\forall v,<v,Tv>=0.

也就是复向量空间下的性质3.

考虑TT变成规范正交基下的上三角矩阵,基是e1ene_1\ldots e_n,则Te1=λ1e1,<e1,Te1>=<e1,λ1e1>=0Te_1=\lambda_1e_1,<e_1,Te_1>=<e_1,\lambda_1 e_1>=0λ1=0\lambda_1=0,Te1=0Te_1=0.

然后你带入e1+e2e_1+e_2,则T(e1+e2)=Te2=ae1+be2,<e1+e2,T(e1+e2)>=0T(e_1+e_2)=Te_2=ae_1+be_2,<e_1+e_2,T(e_1+e_2)>=0a=b=0a=b=0,Te2=0Te_2=0.

反复重复就得到i,Tei=0\forall i,Te_i=0,于是T=0T=0.

这样我们就可以从<v,(TT)v>=0<v,(T-T^*)v>=0得到T=TT=T^*了.

第三行,考虑

u,v,<u,Tv>=<u+v,Tu+Tv><uv,TuTv>4\begin{gathered} \forall u,v, \\ <u,Tv>=\dfrac{<u+v,Tu+Tv>-<u-v,Tu-Tv>}{4} \end{gathered}

于是任意<u,Tv>=0<u,Tv>=0,T=0T=0.

投影算子是自伴算子

<PUu,v>=<PUu,PUv+(vPUv)>=<PUu,PUv>+<PUu,(vPUv)>=<PUu,PUv>=<u,PUv>\begin{gathered} <P_Uu,v>=<P_Uu,P_Uv+(v-P_Uv)>=<P_Uu,P_Uv>+<P_Uu,(v-P_Uv)>=<P_Uu,P_Uv>=<u,P_Uv> \end{gathered}

显然的啦.

正规算子

正规算子

T is normal    TT=TT\begin{gathered} T \text{ is normal} \iff TT^*=T^*T \end{gathered}
T is normal    v,Tv=Tv\begin{gathered} T \text{ is normal} \iff \forall v,\vert\vert Tv \vert\vert = \vert\vert T^*v \vert\vert \end{gathered}
<Tv,Tv>=<TTv,v>=<TTv,v>=<Tv,Tv>\begin{gathered} <Tv,Tv>=<T^*Tv,v>=<TT^*v,v>=<T^*v,T^*v> \end{gathered}
T is normal,λ is eigen value of T    TλI is normal\begin{gathered} T \text{ is normal} ,\lambda \text{ is eigen value of } T \implies T-\lambda I \text{ is normal} \end{gathered}
(TλI)=TλI    (TλI)(TλI)=TT(λ+λ)T+λλ=(TλI)(TλI)\begin{gathered} (T-\lambda I)^*=T^*-\overline{ \lambda } I \\ \implies (T-\lambda I)(T-\lambda I)^* \\ =TT^*-(\lambda+\overline{ \lambda } )T+\lambda \overline{ \lambda } \\ =(T-\lambda I)^*(T-\lambda I) \end{gathered}
T is normal,Tv=λv    Tv=λv\begin{gathered} T \text{ is normal}, Tv=\lambda v \implies T^*v=\overline{ \lambda } v \end{gathered}
(TλI)v=0    (TλI)v=0    (TλI)v=0Tv=λv\begin{gathered} (T-\lambda I)v=0 \\ \implies \vert\vert (T-\lambda I)v \vert\vert =0 \\ \implies \vert\vert (T-\lambda I)^*v \vert\vert =0 \\ T^*v=\overline{\lambda}v \end{gathered}
T is normal    eigen vectors of T are orthogonal\begin{gathered} T \text{ is normal} \implies \text{eigen vectors of } T \text{ are orthogonal} \end{gathered}
let Tu=λ1u,Tv=λ2v(λ2λ1)<u,v>=<u,λ2v><λ1u,v>=<u,Tv><Tu,v>=0\begin{gathered} \text{let } Tu=\lambda_1 u,Tv=\lambda_2 v \\ (\lambda_2-\lambda_1)<u,v> \\ =<u,\lambda_2 v>-<\overline{ \lambda_1 } u,v> \\ =<u,Tv>-<T^*u,v> \\ =0 \end{gathered}

谱定理

复谱定理

复向量空间上,算子正规等价于存在一组由本征向量组成的规范正交基

反向推是显然的:对角矩阵之间乘法是交换的.

正向推:

首先舒尔定理得到一个规范正交基使得矩阵 M(T)=M\mathcal M( T ) =M 是上三角的.

现在利用A=MM=MMA=MM^*=M^*M.

考虑 i=1nMi,i2=<M1,.,M1,.>=<M.,1,M.,1>=M1,12\sum_{i=1}^n \vert M_{i,i} \vert ^2=<M_{1,.},\overline{M_{1,.}}>=<M_{.,1},\overline{M_{.,1}}>=\vert M_{1,1} \vert ^2

于是直接说明了M1,i=0,i>1M_{1,i}=0,i>1.

然后再考虑A2,2A_{2,2}是第二行第二列,可以同理得到<M2,i=0,i>2<M_{2,i}=0,i>2

于是重复上述过程可以证明MM是对角矩阵,得证.

实谱定理

实向量空间上,算子自伴等价于存在一组本征向量组成的规范正交基

反向推依然是显然的,考虑正向.

考虑归纳,先假设对所有小于nn维命题成立.11维显然成立.

取一个规范的本征向量,把它作为基的第一个向量n1n_1,设 U=span(n1)U=\operatorname{span}( n_1 ),则TTUU上不变.

注意到

uU    TuU    vU,TvU\begin{gathered} u\in U \implies Tu\in U \\ \iff v\in U^{\perp},Tv\in U^\perp \end{gathered}
uU,vU    <Tu,v>=0    <u,Tv>=0    TvU\begin{gathered} u\in U,v\in U^{\perp} \\ \implies <Tu,v>=0 \\ \implies <u,Tv>=0 \\ \implies Tv\in U^{\perp} \end{gathered}

于是TTUU^{\perp}上不变,那么对TUT\vert_{U^{\perp}}应用归纳假设,它存在一个由本征向量构成的规范正交基.

现在直接把n1n_1加入进去,显然这是一组本征向量构成的规范正交基.

然后我们发现自己忽略了一件事:我们没有证明这个本征向量是能取出来的.

实向量空间上的自伴算子存在本征值.

考虑经典技巧,对任意vVv\in V,v,Tv,T2vTnvv,Tv,T^2v\ldots T^nv线性相关,存在f(x)Pn s.t. f(T)v=0f(x)\in \mathcal{P}_n \ s.t.\ f(T)v=0

ff质因式分解,

f(x)=ai(xλi)i(x2+bix+ci)f(T)v=ai(TλiI)i(T2+biT+ciI)v=0\begin{gathered} f(x)=a\prod_i (x-\lambda_i)\prod_i (x^2+b_ix+c_i) \\ f(T)v=a\prod_i (T-\lambda_i I)\prod_i (T^2+b_iT+c_iI)v=0 \end{gathered}

由于T2+biT+ciT^2+b_iT+c_i不可分解,有bi24c<0b_i^2-4c<0

我们假设TT没有本征值,则TλiIT-\lambda_i I是单的.

<(T2+biT+ci)v,v>=<((T+bi2I)2+(cb24))v,v>=<(T+bi2I)2v,v>+(cb24)v2=(Tv+biv2)2+(cb24)v2>0\begin{gathered} <(T^2+b_iT+c_i)v,v> \\ =<((T+\dfrac{b_i}{2}I )^2+(c-\dfrac{b^2}{4}))v,v> \\ =<(T+\dfrac{b_i}{2} I)^2v,v>+(c-\dfrac{b^2}{4})v^2 \\ =(Tv+\dfrac{b_iv}{2} )^2+(c-\dfrac{b^2}{4} )v^2 \\ >0 \end{gathered}

于是它也是单的,则f(T)f(T)是单的,和f(T)v=0f(T)v=0矛盾

所以其实TT有本征值是某个λi\lambda_i

正算子,平方根,等距同构

正算子

T is positive    {v,<v,Tv>0T is self-adjoint\begin{gathered} T \text{ is positive} \iff \begin{cases} \forall v,<v,Tv>\ge 0 \\ T \text{ is self-adjoint} \end{cases} \end{gathered}

你会发现正算子其实对应了矩阵中的半正定矩阵.

平方根

T=R2    R is squre root of T\begin{gathered} T=R^2 \iff R \text{ is squre root of T} \end{gathered}

下列条件等价:

T is positiveT is self-adjoint and each T’s eigenvalues is not negativeT has positive squre rootT has adjoint squre rootR,T=RR\begin{gathered} T \text{ is positive} \\ T \text{ is self-adjoint and each T's eigenvalues is not negative} \\ T \text{ has positive squre root} \\ T \text{ has adjoint squre root} \\ \exists R,T=R^*R \end{gathered}

由第一行推第二行:显然自伴,只要说明本征值非负.

由刚才谱定理,作为自伴矩阵它有规范正交基下的对角形式.而对角形式下,取一个本征向量vv乘它,如果对应本征值λ<0\lambda<0<v,Tv>=λv2<0<v,Tv>=\lambda v^2<0,矛盾.于是得证.

第二行推第三行:仍然在对角形式下操作,把对角线每个元素算术平方根,容易发现你得到一个正平方根.

第三行推四行是显然.

第四行推第五行显然,因为对自伴算子RR满足T=R2T=R^2R=RR=R^*

第五行推第一行,首先容易验证(RR)=R(R)=RR(R^*R)^*=R^*(R^*)^*=R^*R,TT是自伴.再考虑<v,RRv>=<Rv,Rv>0<v,R^*Rv>=<Rv,Rv>\ge 0于是得证.

正算子有唯一的正平方根.

于是可以记TT的唯一正平方根为T\sqrt T

首先由之前从 T is positive    T=S2,S is positiveT \text{ is positive} \implies T=S^2,S \text{ is positive}中我们会证存在性(对角矩阵然后给每个本征值开根).

现在考虑已经有一个正平方根SS,取SS的本征向量构成的规范正交基e1ene_1\ldots e_n,再取TT的本征向量vv,有

{Tv=λvv=i=1n<v,ei>ei    Tv=i=1nλ<v,ei>R2v=i=1nλi2<v,ei>ei=Tv=i=1nλ<v,ei>    i=1n(λi2λ)<v,ei>ei=0    i,<v,ei>0:λi2=λ    Rv=λiv=λv\begin{gathered} \begin{cases} Tv=\lambda v \\ v=\sum _{i = 1} ^{n} <v,e_i>e_i \end{cases} \\ \implies Tv=\sum _{i = 1} ^{n} \lambda <v,e_i> \\ R^2v=\sum _{i = 1} ^{n} \lambda_i^2 <v,e_i>e_i=Tv=\sum _{i = 1} ^{n} \lambda <v,e_i> \\ \implies \sum _{i = 1} ^{n} (\lambda_i^2-\lambda)<v,e_i>e_i=0 \\ \implies \forall i,<v,e_i>\ne 0:\lambda_i^2=\lambda \\ \implies Rv=\lambda_i v=\sqrt{\lambda} v \end{gathered}

于是可以证明RRTT的每个本征向量的作用都与前面通过对角线直接取平方根构造出的R0R_0相同,故R=R0R=R_0

等距同构

T is an isometry    v,Tv=v\begin{gathered} T \text{ is an isometry} \iff \forall v,\vert\vert Tv \vert\vert =\vert\vert v \vert\vert \end{gathered}

下列条件等价:

T is an isometryu,v,<Tu,Tv>=<u,v>orthonormal base e,Te1Ten is orthonormalorthonormal base e,Te1Ten is orthonormalTT=ITT=IT=T1\begin{gathered} T \text{ is an isometry} \\ \forall u,v,<Tu,Tv>=<u,v> \\ \forall \text{orthonormal base } e, Te_1\ldots Te_n \text{ is orthonormal} \\ \exists \text{orthonormal base } e, Te_1\ldots Te_n \text{ is orthonormal} \\ TT^*=I \\ T^*T=I \\ T^*=T^{-1} \end{gathered}

第一行等价第二行:我们之前证过可以由范数计算内积,于是保范数和保内积等价.

前两行推第三行是显然的:<Tei,Tej>=<ei,ej>=0<Te_i,Te_j>=<e_i,e_j>=0,同时长度显然也不变.

第三行推第四行是显然的.

第四行推第五行:考虑u,v:<u,Tv>=<Tu,v>=<TTu,Tv>\forall u,v:<u,Tv>=<T^*u,v>=<TT^*u,Tv>,于是<(TTI)u,v>=0<(TT^*-I)u,v>=0,可以说明TT=ITT^*=I

于是T=T1T^*=T^{-1},而证明群里的逆元是交换的是经典的,于是后三条是一起的.

最后,如果T=T1T^*=T^{-1},Tv2=<Tv,Tv>=<TTv,v>=v\vert\vert Tv \vert\vert^2=\sqrt{<Tv,Tv>}=\sqrt{<T^*Tv,v>}=\vert \vert v\vert \vert,得证.

复向量空间下

T is an isometry    orthonormal base e,i,Tei=λiei,λi=1\begin{gathered} T \text{ is an isometry} \\ \iff \exists \text{orthonormal base }e, \\ \forall i, Te_i=\lambda_i e_i,\vert \lambda_i \vert =1 \end{gathered}

首先证明逆向,则在基eeTT是对角矩阵且对角线元素模长为11,容易验证TT=ITT^*=I,说明TT是等距同构.或者你慢慢写验证保持范数也是简单的.

然后正向:取TT的本征向量构成的规范正交基,于是TT是对角矩阵且TT=ITT^*=I,也是显然的.

极分解,奇异值分解

极分解

T=STT,S is isometry\begin{gathered} T=S\sqrt{T^*T},S \text{ is isometry} \end{gathered}

首先我们之前说明过TTT^*T是正的,于是这个平凡根存在.且

Tv=<Tv,Tv>=<TTv,v>=<TTv,TTv>=TTv\begin{gathered} \vert\vert Tv \vert\vert =\sqrt{<Tv,Tv>}=\sqrt{<T^*Tv,v>} \\ =\sqrt{<\sqrt{T^*Tv},\sqrt{T^*T}v>}=\vert\vert \sqrt{T^*T}v \vert\vert \end{gathered}

于是SS可以是等距同构的,在 rangeTTrangeT\operatorname{range} \sqrt{T^*T} \to \operatorname{range} T上我们定义:

S1TTv=Tv\begin{gathered} S_1\sqrt{T^*T}v=Tv \end{gathered} S1TT(v1+v2)=T(v1+v2)    S1(TTv1)+S1(TTv2)=Tv1+Tv2S1TTkv1=kTv1\begin{gathered} S_1\sqrt{T^*T}(v_1+v_2)=T(v_1+v_2) \\ \implies S_1(\sqrt{T^*T}v_1)+S_1(\sqrt{T^*T}v_2)=Tv_1+Tv_2 \\ S_1\sqrt{T^*T}kv_1=kTv_1 \end{gathered}

这样可以说明S1S_1是线性变换.

并且

TTv1=TTv2    TT(v1v2)=0    T(v1v2)=0    Tv1=Tv2\begin{gathered} \sqrt{T^*T}v_1= \sqrt{T^*T}v_2 \\ \iff \vert\vert \sqrt{T^*T}(v_1-v_2) \vert\vert =0 \\ \iff \vert\vert T(v_1-v_2) \vert\vert =0 \\ \iff Tv_1=Tv_2 \end{gathered}

于是S1S_1是单射.显然也是满射.于是S1S_1是双射.

于是

dimrangeTT=dimrangeT    dim(rangeTT)=dim(rangeT)\begin{gathered} \dim \operatorname{range} \sqrt{T^*T}=\dim \operatorname{range} T \\ \implies \dim (\operatorname{range} \sqrt{T^*T})^\perp=\dim (\operatorname{range} T)^\perp \end{gathered}

于是可以从 (rangeTT)(\operatorname{range} \sqrt{T^*T})^\perp(rangeT)(\operatorname{range} T)^\perp中分别取一组规范正交基e1ene_1\ldots e_n,f1fnf_1\ldots f_n,那么只要让

S2L((rangeTT),(rangeT))S2(iciei)=icifi\begin{gathered} S_2\in \mathcal L( (\operatorname{range} \sqrt{T^*T})^\perp , (\operatorname{range} T)^\perp ) \\ S_2(\sum_i c_ie_i)=\sum_i c_if_i \end{gathered}

并最后让S=S1+S2S=S_1+S_2即可.

Q.E.D\begin{gathered} \text{Q.E.D} \end{gathered}

奇异值

TT的奇异值即TT\sqrt{T^* T}的本征值,且每个值λ\lambda重复dimE(λ,TT)\dim E(\lambda,\sqrt{T^ *T})次.

奇异值分解

对算子TTs1sns_1\ldots s_nTT的奇异值,则存在两组规范正交基e1ene_1\ldots e_n,f1fnf_1\ldots f_n,使得Tv=isi<v,ei>fiTv=\sum_i s_i<v,e_i>f_i.

TT\sqrt{T^*T}好在它是正的,于是谱定理可以找到一组基ee使得TTei=siei,TTv=isi<v,ei>ei\sqrt{T^*T}e_i=s_ie_i,\sqrt{T^*T}v=\sum_i s_i<v,e_i>e_i.

那么极分解T=STTT=S\sqrt{T^*T},于是

Tv=STTv=Sisi<v,ei>ei=isi<v,ei>Sei=isi<v,ei>fi\begin{gathered} Tv=S\sqrt{T^*T}v \\ =S\sum_i s_i<v,e_i>e_i \\ =\sum_i s_i<v,e_i>Se_i \\ =\sum_i s_i<v,e_i>f_i \end{gathered}

因为SS是等距同构所以把规范正交基变换成规范正交基.

零空间链,幂零算子,广义本征空间

0=nullT0,nullTinullTi+1nullTi=nullTi+1    j>i,nullTj=nullTinullTdimV=nullTdimV+1\begin{gathered} {0}=\operatorname{null} T^0,\operatorname{null} T^i \subset \operatorname{null} T^{i+1} \\ \operatorname{null} T^i= \operatorname{null} T^{i+1} \implies \forall j>i,\operatorname{null} T^j=\operatorname{null} T^i \\ \operatorname{null} T^{\dim V}=\operatorname{null} T^{\dim V+1} \\ \end{gathered}

前两行是显然的

第三行也是显然的:UU的真子空间的维数必须小于UU.

V=nullTdimVrangeTdimV\begin{gathered} V=\operatorname{null} T^{\dim V} \oplus \operatorname{range} T^{\dim V} \end{gathered}

首先维数满足条件,并且交是 {0}\{ 0 \},所以成立.

幂零算子

TT满足n,Tn=0\exists n,T^n=0(显然可以让n=dimVn=\dim V)

存在一组基使得幂零算子的矩阵为严格上三角矩阵.

先取 nullT\operatorname{null} T 的基,不够就加入 nullT2\operatorname{null} T^2 零空间的基扩充,然后加 nullT3\operatorname{null} T^3的,直到加到nn个.

注意到对来自 nullTk\operatorname{null} T^k 的基ee,TenullTk1Te\in \operatorname{null} T^{k-1},于是是严格上三角矩阵.

广义本征向量

n,(TλI)nv=0    v is generalized eigen vector of T.\begin{gathered} \exists n,(T-\lambda I)^nv=0 \\ \iff v \text{ is generalized eigen vector of } T. \end{gathered}
(TλI)nv=0    λ is eigenvalue of T\begin{gathered} (T-\lambda I)^n v=0 \implies \lambda \text{ is eigenvalue of } T \end{gathered}

因为显然TλIT-\lambda I不是单的.

广义本征空间

G(λ,T)=null(TλI)dimV\begin{gathered} G(\lambda,T)=\operatorname{null} (T-\lambda I)^{\dim V} \end{gathered}

就是广义本征向量的张成空间.

不同广义本征空间中的向量线性无关.

viG(λi,T)    {vn} is linear independent\begin{gathered} v_i\in G(\lambda_i,T) \\ \implies \{ v_n \} \text{ is linear independent} \end{gathered}
let k=maxi(Tλ1I)iv10let w=(Tλ1I)kv1    Tw=λ1wlet F=(Tλ1I)ki(TλiI)ni=1ncivi=0    Fi=1ncivi=0    Fc1v1=0    c1w=0    c1=0\begin{gathered} \text{let } k=\max {i\vert (T-\lambda_1 I)^i v_1\ne 0} \\ \text{let } w=(T-\lambda_1 I)^k v_1 \\ \implies Tw=\lambda_1w \\ \text{let } F=(T-\lambda_1I)^k\prod_i (T-\lambda_iI)^n \\ \sum _{i = 1} ^{n} c_iv_i=0 \\ \implies F\sum _{i = 1} ^{n} c_iv_i=0 \\ \implies Fc_1v_1=0 \\ \implies c_1w=0 \\ \implies c_1=0 \end{gathered}

于是对所有viv_i做一遍可以得到cc全是00,得证.

任意复向量空间上的算子TT的所有本征值λ1λk\lambda_1\ldots \lambda_k满足

iG(λi,T)=VidimG(λi,T)=dimVe1en,ei is generalized eigenvector,{en} is basis of V(TλiI)G(λi,T)is nilpotent\begin{gathered} \bigoplus_i G(\lambda_i,T)=V \\ \sum_i \dim G(\lambda_i,T)=\dim V \\ \exists e_1\ldots e_n,e_i \text{ is generalized eigenvector} ,\{ e_n \} \text{ is basis of } V \\ (T-\lambda_iI)\vert_{G(\lambda_i,T)} \text{is nilpotent} \end{gathered}

先证第一行.

归纳,因为TT有本征值,取一本征值λ\lambda,则 V=G+range(TλI)V=G+\operatorname{range} (T-\lambda I), U=rangeTλIU=\operatorname{range} T-\lambda ITT下不变,于是对TUT\vert_U给出UU的分解再加上G(λ,T)G(\lambda,T)即可.

显然TUT\vert_U不会有λ\lambda作为本征值.证明是成立的.

第一行成立后第二行第三行是显然的.第四行不需要第一行就是显然的.

为什么你不能对普通本征空间这么干而必须广义呢?因为普通本征空间没有 nullTλIrangeTλI=V\operatorname{null} T-\lambda I\oplus \operatorname{range} T-\lambda I=V的性质,你分解的时候递归不下去(去掉E(λ,I)E(\lambda,I)剩下的不是不变子空间)

代数重数,几何重数

代数重数=dimG(λ,T)几何重数=dimE(λ,T)\begin{gathered} \text{代数重数} =\dim G(\lambda,T) \\ \text{几何重数} =\dim E(\lambda,T) \end{gathered}

TT有本征值λ1λm\lambda_1\ldots \lambda_m,则存在一组基使得 M(T)=Diag(A1,,Am)\mathcal M( T ) =\operatorname{Diag}(A_1,\ldots,A_m)其中每个AA为对角线上全为λ\lambda的上三角矩阵.

我们已经说明了V=iG(λi,T)V=\bigoplus_i G(\lambda_i,T),则取所有广义本征向量做基就有 Ai=M(TG(λi,T))A_i=\mathcal M( T\vert_{G(\lambda_i,T)} ),又因为

我们知道TG(λi,T)λiIT\vert_{G(\lambda_i,T)}-\lambda_i I是幂零的,于是它有一个严格上三角,那么你再加回去λiI\lambda_i I就满足条件了.

我们希望进一步改进这个结果,就要改进幂零算子的结构:

幂零算子NN满足,存在v1vkV,m1mkNv_1\ldots v_k\in V,m_1\ldots m_k\in N使得:

  • v1,Nv1,,Nm1v1,v2,Nv2,,Nm2v2,,Nvn,Nmkvnv_1,Nv_1,\ldots, N^{m_1}v_1,v_2,Nv_2,\ldots, N^{m_2}v_2,\ldots,Nv_n,\ldots N^{m_k}v_nVV的基.
  • i,Nmi+1vi=0\forall i,N^{m_i+1}v_i=0

你可以发现,在这组基下,幂零算子被干成了分块对角矩阵,且每个块内只有对角线上面一条对角线是11,其余位置是00.

考虑归纳法,归纳就要找不变子空间,比如找到 rangeN\operatorname{range} N ,显然 dimrangeN<dimV\dim \operatorname{range} N<\dim V ,于是 NrangeNN\vert_{\operatorname{range} N} 有这样一组基 v1vkrangeN,m1mkNv_1\ldots v_k\in \operatorname{range} N,m_1\ldots m_k\in N 满足基的条件.

virangeN    ui,Nui=vi\begin{gathered} v_i\in\operatorname{range} N \\ \implies \exists u_i,Nu_i=v_i \end{gathered}

于是用u1uku_1\ldots u_k替换v1vkv_1\ldots v_k并加入他们自己,得到 Nm1u1,,u1,,Nmkuk,,uk={en}N^{m_1}u_1,\ldots, u_1,\ldots, N^{m_k}u_k,\ldots, u_k = \{ e_n \}.

考虑若 i=1nciei=0\sum _{i = 1} ^{n} c_ie_i=0 ,则 0=i=1nciNei0=\sum _{i = 1} ^{n} c_iNe_i ,但NeiNe_irangeV\operatorname{range} V 的基是不相关的.于是ee线性无关.

那么考虑又添加 w1wlw_1\ldots w_l 扩充得 e1en,w1wle_1\ldots e_n,w_1\ldots w_l 是基.对任意ww,一定有 wrangeNw\notin \operatorname{range} N,而现在的唯一问题是NwNw可能不为00,注意到因为 span({Nei})=rangeN\operatorname{span}( \{ Ne_i \} ) =\operatorname{range} N,于是 xspan({ei}),Nx=Nw\exists x\in \operatorname{span}( \{ e_i \} ) ,Nx=Nw,于是取en+i=wixie_{n+i}=w_i-x_i即可.

于是你构造出了NN的基,归纳得证.

[think] 归纳解决存在基满足xx的问题是有效的(复向量的上三角,两种谱定理,到这个Jordan分解等等),要有条件构造不变子空间.

同时这个是在说,幂零矩阵满足存在一组基使得它的矩阵是分块对角矩阵,且每个块只有对角线上方的一行斜线元素都是11,其他都是00.

Jordan分解

存在一组基ee满足

M(T,e)=Diag(AiAk),Ai=λiI+[0,1,0,00,0,1,,00,0,,0,10,0,,0,0]\begin{gathered} \mathcal M( T,e ) =\operatorname{Diag}(A_i\ldots A_k), \\ A_i=\lambda_i I+ \begin{bmatrix} 0,1,0\ldots,0 \\ 0,0,1,\ldots,0 \\ \ldots \\ 0,0,\ldots,0,1 \\ 0,0,\ldots,0,0 \end{bmatrix} \end{gathered}

水到渠成了.

每组λ\lambda相同的块AiA_i对应了一个TG(λi,T)T\vert_{G(\lambda_i,T)},而已知TG(λi,T)λIT\vert_{G(\lambda_i,T)}-\lambda I是幂零的,而刚才说过幂零矩阵有由只有对角线上方一斜线是11的块构成的分块对角矩阵,再加上λI\lambda I就是这样了.

平方根

I+NI+N有平方根

(1+x)12=i=0(12i)xilet Sn(x)=i=02(12i)xik<n,[xk]Sn2(x)=i=0k(12i)(12ki)=(1k)=[k1]\begin{gathered} (1+x)^{\frac{1}2}=\sum _{i = 0} ^{\infty} \binom{\frac12}{i}x^i \\ \text{let } S_n(x)=\sum _{i = 0} ^{2} \binom{\frac12}{i}x^i \\ \forall k<n,[x^k]S_n^2(x)= \sum _{i = 0} ^{k} \binom{\frac12}{i}\binom{\frac12}{k-i} =\binom{1}{k}=[k\le 1] \end{gathered}

于是Sn(x)S_n(x)1+x\sqrt{1+x}的前kk项一样,而NN是幂零的保证了它没有某项以后的,于是只要取一个Sn(N)S_n(N)就是I+N\sqrt{I+N}.

CC上可逆算子有平方根.

约旦分解,给每个λI+N\lambda I+N形式找一个平方根,再拼回来.

特征多项式和极小多项式

特征多项式

p(z)=i=1k(zλi)cici=dimE(λi,T)\begin{gathered} p(z)=\prod _{i = 1} ^{k} (z-\lambda_i)^{c_i} \\ c_i=\dim E(\lambda_i,T) \end{gathered}

特征多项式的次数和零点

degp(z)=dimVp(z)=0    z is eigenvalue of T\begin{gathered} \deg p(z)=\dim V \\ p(z)=0 \iff z \text{ is eigenvalue of } T \end{gathered}

显然吧.

Caylay-Hamilton Theorem

TT的特征多项式p(z)p(z)满足p(T)=0p(T)=0

因为TT可以拆成广义本征空间直和上的TG(λi,T)T\vert_{G(\lambda_i,T)},而TG(λi,T)T\vert_{G(\lambda_i,T)}是幂零的,于是(TG(λi,T)λiI)dimG(λi,T)=0(T\vert_{G(\lambda_i,T)}-\lambda_iI)^{\dim G(\lambda_i,T)}=0.

p(T)p(T)显然包含这个因子,于是每个G(λi,T)G(\lambda_i,T)上都有p(TGλi,T)=0p(T\vert_{G\lambda_i,T})=0,于是p(T)=0p(T)=0

极小多项式

对于TT,p(z)p(z)是满足最高次项为11p(T)=0p(T)=0的多项式中次数最小的一个.

极小多项式唯一

assume p,q is minimal polynomialp(T)=0,q(T)=0,degp=degq    (pq)(T)=0,degpq<min(degp,degq)\begin{gathered} \text{assume }p,q \text{ is minimal polynomial} \\ p(T)=0,q(T)=0,\deg p=\deg q \\ \implies (p-q)(T)=0,\deg p-q<\min(\deg p,\deg q) \end{gathered}

于是和p,qp,q极小矛盾,得证.

任意满足q(T)=0q(T)=0的多项式是极小多项式p(z)p(z)的倍式.

考虑qmodp=f,f0q \bmod p=f,f\ne 0,则f(T)=q(T)kp(T)=0f(T)=q(T)-kp(T)=0degf<degp\deg f<\deg p,则与pp极小矛盾.得证.

TT的本征值是其极小多项式p(z)p(z)的零点

Tv=λvTv=\lambda v,p(T)=0p(T)=0,则p(T)v=p(λ)v=0p(T)v=p(\lambda)v=0,于是p(λ)=0p(\lambda)=0.

p(λ)=0p(\lambda)=0λ\lambda不是本征值,则TλIT-\lambda I是满秩的,则设p(T)=(TλI)q(T)p(T)=(T-\lambda I)q(T),p(T)=0    q(T)=0p(T)=0 \iff q(T)=0,与pp极小矛盾.

得证.

实向量空间复化

复化

VV的复化是VC=V×VV_C=V\times V,但是把(u,v)(u,v)写作u+ivu+iv.

TT的复化是TC(u+iv)=Tu+iTvT_C(u+iv)=Tu+iTv

共轭

u+iv=uiv\overline{ u+iv } =u-iv

Tv=T(v)\overline{ T } v=\overline{ T(\overline{ v } ) }

容易验证 T\overline{ T }之间的加法,数乘,复合( ST=ST\overline{ S } \circ \overline{T}=\overline{ST} )运算是有共轭的性质的.

知乎老哥提醒大家, 复向量空间取共轭的操作是依赖额外结构的,不是所有复向量空间都是某个实向量空间的复化.

实向量空间上每个算子都有一维或二维不变子空间

考虑它的复化TCT_C一定有本征值,设为λ=a+bi\lambda=a+bi.

那么对任意u+viu+vi,T(u+vi)=(a+bi)(u+vi)=aubv+i(av+bu)T(u+vi)=(a+bi)(u+vi)=au-bv + i(av+bu)

于是u,vu,v张成的二维不变子空间在TT下不变.

  • 复化保持基不变
  • 复化保持矩阵不变
  • 复化保持极小多项式不变
  • 复化后的实本征值是复化前的本征值
  • 复本征值以共轭的形式成对出现,重数相等

第一条,对一组基e1ene_1\ldots e_n,有 uspan(e),vspan(ie1,,ien)u\in \operatorname{span}( e ) ,v\in \operatorname{span}( ie_1,\ldots,ie_n ),得证.

第二条,因为基不变所以矩阵不变.

第三条,考虑p(T)=0p(T)=0显然有p(TC)=0p(T_C)=0.而若q(TC)=0q(T_C)=0,取每个系数的实部得到新的多项式r(TC)r(T_C)一定有r(TC)v=0,vVr(T_C)v=0,\forall v\in V.于是若ppTT的极小多项式,那么不能存在q(TC)=0q(T_C)=0degq<degp\deg q<\deg p,于是pp也是TCT_C的极小多项式.

这也保证了复化出来的变换的极小多项式系数都是实数.

第四条,本征值是极小多项式的零点,极小多项式不变故本征值不变.

第五条,极小多项式系数都是实数于是在实数下可以分解成若干一次项和二次函数的乘积,分别对应了单独出现的实本征值和成对出现的复本征值.

TT的特征多项式定义为TCT_C的特征多项式.

我们要说明这个定义的合理性:

TCT_C的特征多项式系数都是实数.

考虑:

λ\lambdaλ\overline{ \lambda }重数相同.

(TλI)kv=0    (TλI)kv=0(TλI)kv=0\begin{gathered} (T-\lambda I)^kv=0 \\ \implies \overline{ (T-\lambda I)^k v } =0 \\ (T-\overline{\lambda}I)^k \overline{ v }=0 \end{gathered}

于是若v1vkv_1\ldots v_kG(λ,T)G(\lambda,T)的基,那么 v1,,vn\overline{ v_1 } ,\ldots, \overline{v_n}G(λ,T)G(\overline{\lambda},T)的基,得证.

于是你只要把成对出现的(xλ)(xλ)(x-\lambda)(x-\overline{\lambda})合成一个就可以得到实系数二次式.

于是系数全是实的.

实空间的正规算子

我们定义

内积的复化

<a+bi,c+di>=<a+bi,c>+i<a+bi,d>=<c,a+bi>+i<d,a+bi>=<a,c><b,c>i+i<a,d>+<b,d>=(<a,c>+<b,d>)+i(<a,d><b,c>)\begin{gathered} <a+bi,c+di> \\ =<a+bi,c>+i<a+bi,d> =\overline{ <c,a+bi> } +i \overline{ <d,a+bi> } \\ =<a,c>-<b,c>i+i<a,d>+<b,d> \\ =(<a,c>+<b,d>) + i(<a,d>-<b,c>) \end{gathered}

我们定义的复化的内积也满足内积的定义.

(TC)=(T)C(T_C)^*=(T^*)_C

正规算子的复化还是正规算子.

第一条容易验证是对的.

第二条考虑

<T(a+bi),c+di>=(<Ta,c>+<Tb,d>+i(<Ta,d><Tb,c>))=(<a,Tc>+<b,Td>+i(<a,Td><b,Tc>))=<a+bi,T(c+di)>\begin{gathered} <T(a+bi),c+di> \\ =(<Ta,c>+<Tb,d>+i(<Ta,d>-<Tb,c>)) \\ =(<a,T^*c>+<b,T^*d>+i(<a,T^*d>-<b,T^*c>)) \\ =<a+bi,T^*(c+di)> \end{gathered}

第三条考虑TT=TT,TC(TC)=TC(T)C=(TT)C=(TT)C=TC(TC)TT^*=T^*T,T_C(T_C)^*=T_C(T^*)_C=(TT^*)_C=(T^*T)_C=T_C(T_C)^*

T is normal    e1en is orthonormal basis ,M(T,e)=Diag(A1Ak),Ak=[x] or A=[a bb a]\begin{gathered} T \text{ is normal} \\ \iff \exists e_1\ldots e_n \text{ is orthonormal basis }, \\ \mathcal M( T,e ) = \operatorname{Diag}(A_1\ldots A_k) , \\ A_k= [x] \text{ or } A=\begin{bmatrix} a\ -b \\ b\ a \end{bmatrix} \end{gathered}

于是我们复化得到TCT_C,TCT_C是正规的,有谱定理,存在一组本征向量构成的规范正交基.

考虑规范正交基的每个本征值λi\lambda_i

λiR,(a+bi)E(λi,TC)\lambda_i\in R,(a+bi)\in E(\lambda_i,T_C),则T(a+bi)=λia+λibiT(a+bi)=\lambda_i a+\lambda_i bi,于是可以分离实部虚部,则a,bE(λi,T)a,b\in E(\lambda_i,T).

λi=a+bi∉R\lambda_i=a+bi\not\in R,有abia-bi也是重数相等的本征值,从两个对应的本征空间中分别取一个向量c+di,cdic+di,c-di.

{T(c+di)=(a+bi)(c+di)T(cdi)=(abi)(cdi)    {Tc=acbdTd=bc+ad\begin{gathered} \begin{cases} T(c+di)=(a+bi)(c+di) \\ T(c-di)=(a-bi)(c-di) \end{cases} \\ \implies \begin{cases} Tc=ac-bd \\ Td=bc+ad \end{cases} \\ \end{gathered}

于是TTc,dc,d长成的二维子空间不变.

因为你复的情况是有nn个本征值的,于是你这么做能得到VV的子空间分解U1UkU_1\ldots U_k,dimUk2\dim U_k\le 2.

且对于dimUk=2\dim U_k=2,就用d,cd,c做基它的矩阵看起来是

[b,aa,b]\begin{gathered} \begin{bmatrix} b, a \\ -a, b \end{bmatrix} \end{gathered}

即为所证.

T is isometry    e1en is orthonormal basisM(T,e)=Diag(A1Ak),Ak=[x] or A=[cosθ sinθsinθ cosθ]\begin{gathered} T \text{ is isometry} \\ \iff \exists e_1\ldots e_n \text{ is orthonormal basis} \\ \mathcal M( T,e ) =\operatorname{Diag}(A_1\ldots A_k), \\ A_k=[x] \text{ or } A=\begin{bmatrix} \cos\theta\ -\sin\theta \\ \sin\theta\ \cos\theta \end{bmatrix} \end{gathered}

整个证明流程与正规完全一致.只不过最后那个矩阵中 a+bi=1\vert a +bi\vert=1,所以能化出来cos,sin\cos,\sin形式.

矩阵

基变更公式

设两组基e1ene_1\dots e_n,f1fnf_1\ldots f_n,MMTTff下的矩阵,有矩阵AA满足

Afi=j=1nAj,iej\begin{gathered} Af_i=\sum _{j = 1} ^{n} A_{j,i}e_j \end{gathered}

AMA1AMA^{-1}TTee下的变换矩阵.

你直接尝试理解就好了:AvAv就是把ff表示下的向量变成了ee表示的向量.

另外,我们设E=[e1en]E=[e_1\ldots e_n],F=[f1fn]F=[f_1\ldots f_n],则A=F1EA=F^{-1}E.(其实就是到标准基的基变换).

traceT=i=1nλitraceM(T)=i=1nM(T)i,i\begin{gathered} \operatorname{trace} T=\sum _{i = 1} ^{n} \lambda_i \operatorname{trace} \mathcal M( T ) =\sum _{i = 1} ^{n} \mathcal M( T ) _{i,i} \end{gathered}

注意λ\lambda按代数重数重复.实向量空间的先复化.

traceAB=traceBA\begin{gathered} \operatorname{trace} AB=\operatorname{trace} BA \end{gathered}
i=1n(AB)i,i=i=1nj=1nAi,jBj,ii=1n(BA)i,i=i=1nj=1nBi,jAj,i\begin{gathered} \sum _{i = 1} ^{n} (AB)_{i,i}=\sum _{i = 1} ^{n} \sum _{j = 1} ^{n} A_{i,j}B_{j,i} \\ \sum _{i = 1} ^{n} (BA)_{i,i}=\sum _{i = 1} ^{n} \sum _{j = 1} ^{n} B_{i,j}A_{j,i} \end{gathered}

交换求和号显然相等.

traceT=traceM(T)\begin{gathered} \operatorname{trace} T=\operatorname{trace} \mathcal M( T ) \end{gathered}

实空间先复化.考虑复空间.

那么有一组基使得 M(T)\mathcal M( T ) 是上三角矩阵AA,此时显然成立.

而根据基变换公式,任意一组基下的 M(T)=QAQ1\mathcal M( T ) =QAQ^{-1}.

traceQAQ1=traceAQQ1=traceA=traceT\begin{gathered} \operatorname{trace} QAQ{-1}=\operatorname{trace} AQQ^{-1}=\operatorname{trace} A=\operatorname{trace} T \end{gathered}

行列式

定义为iλi\prod_i \lambda_i.同样按重数重复.同样复化.

TT的特征多项式等于det(zIT)\det(zI-T)

考虑在TT有一组基是上三角矩阵,此时容易看出zITzI-T的特征值就是所有zλiz-\lambda_i,结束.

detM=pi=1nMi,pi(1)rev(p)\begin{gathered} \det M=\sum _{p} \prod _{i = 1} ^{n} M_{i,p_i}(-1)^{\operatorname{rev}(p)} \end{gathered}

很难的啊

证明路径大概是,我们先说明行列式的det(AB)=detAdetB\det(AB)=\det A\det B,然后通过分解M=LUM=LU算出是特征值之积这样.

而这个公式是怎么来的呢,大概是我们先规定有:

  • 多重线性:对每一行线性(齐性和加性)
  • 交替:交换两行,行列式取反
  • 单位:detI=1\det I=1

通过这三条可以容易的算出来行列式的这个表示,每行线性你就把一行拆成对nn个这一行只有一个元素其余都是00的矩阵累加,再把这个非零元提到矩阵外面变成常数,每一行都这么干,则问题就变成了若干个全11的置换矩阵乘上系数,你再发现置换矩阵的行列式根据第二条第三条性质会写成排列逆序对就做完了.

那怎么说明矩阵乘积的行列式不变呢?

这里gemini用的方法是定义函数 F(A)=ABdetB)F(A)=\dfrac{AB}{\det B} ),证明它满足行列式的三条规定,而三条规定等价于行列式,于是F(A)=detAF(A)=\det A.

第三条显然,第一条第二条考虑ABAB本来就是BB乘上AA的每一行拼起来所以也显然.

然后你就可以推出这种定义和特征根乘积定义的等价性了.

第三版的内容到此结束.剩下的随缘更.

补充

Gershgorin

矩阵AA的所有特征值λ\lambda都满足存在kk使得

λAk,kikAi,k\begin{gathered} \vert \lambda-A_{k,k} \vert \le \sum_{i\ne k} \vert A_{i,k} \vert \end{gathered}

考虑一组Av=λvAv=\lambda v

则选取vv绝对值最大的分量vkv_k,那么它满足:

iAk,ivi=λvk    (λAk,k)vk=ikAk,ivi    (λAk,k)vk=ikAk,ivi    λAk,kvkikAk,ivk\begin{gathered} \sum_i A_{k,i}v_i=\lambda v_k \\ \implies (\lambda-A_{k,k})v_k=\sum_{i\ne k}A_{k,i}v_i \\ \implies \vert (\lambda-A_{k,k})v_k \vert =\vert \sum_{i\ne k}A_{k,i}v_i \vert \\ \implies \vert \lambda-A_{k,k} \vert \vert v_k \vert \le \sum_{i\ne k} \vert A_{k,i} \vert \vert v_k \vert \end{gathered}

除过去即证.

关于交换矩阵

AB=BA    E(λ,A) is invariant to B\begin{gathered} AB=BA \implies E(\lambda,A) \text{ is invariant to } B \end{gathered}
ABv=BAV    A(Bv)=λ(Bv)\begin{gathered} ABv=BAV \\ \implies A(Bv)=\lambda (Bv) \end{gathered}

可对角化矩阵可交换等价于可同时对角化

从同时对角化推交换是显然的.

考虑现在AB=BAAB=BA,那由上面的不变性可以考虑BE(λ,A)B\vert_{E(\lambda,A)},注意到它一定也是可对角化的(为什么呢,考虑可对角化等价于极小多项式无重根,而BE(λ,A)B\vert_{E(\lambda,A)}的的极小多项式是BB的因数).那么你可以在这一小块把BE(λ,A)B\vert_{E(\lambda,A)}对角化,而AE(λ,A)A\vert_{E(\lambda,A)}一定是对角阵,每块都这么做一下就好了.

复矩阵可交换等则同时上三角化

感觉把舒尔定理取一个特征向量那步改成取公共特征向量是不是就行了.