← 返回博客列表

线性代数术语词典:概念解释、词间关系、记忆要点

ryou

原文地址:https://www.cnblogs.com/ryuo-ou/p/19873458 同步说明:该文已完整同步到站内博客,便于统一检索和阅读。

1. 基础对象

1.1 标量(Scalar)

就是一个普通数字,比如 2、-1、3.14。

1.2 向量(Vector)

一串有顺序的数,可以理解为“一个点的位置”或“一个方向”。
例如 \(x=(x_1,x_2,\dots,x_n)^T\)

1.3 矩阵(Matrix)

按行列排好的数字表。
做题里最常见作用:把一个向量变成另一个向量

1.4 维数(Dimension)

一个空间里“独立方向”的个数。

1.5 线性变换(Linear Transformation)

满足“先加后变换”和“先数乘后变换”的规则:

\[T(u+v)=T(u)+T(v),\quad T(\alpha u)=\alpha T(u) \]

通俗说:它不会把直线扭成弯线。


2. 矩阵运算

2.1 转置(Transpose)

把矩阵行和列交换,记作 \(A^T\)

2.2 逆矩阵(Inverse Matrix)

矩阵版“倒数”,记作 \(A^{-1}\)。满足 \(AA^{-1}=A^{-1}A=I\)

2.3 单位矩阵(Identity Matrix)

记作 \(I\),对角线是 1,其余是 0。相当于矩阵里的“数字 1”。

2.4 行列式(Determinant)

记作 \(\det(A)\)
最实用结论:\(\det(A)=0\) 时,逆矩阵不存在。

2.5 秩(Rank)

记作 \(r(A)\),表示矩阵里最多有多少个“互不重复信息”的行或列。

2.6 迹(Trace)

记作 \(\operatorname{tr}(A)\),就是主对角线求和。

2.7 正交矩阵(Orthogonal Matrix)

满足 \(Q^TQ=I\)
常背性质:\(Q^{-1}=Q^T\)\(\det(Q)=\pm1\)

2.8 对称矩阵(Symmetric Matrix)

满足 \(A^T=A\)
实对称矩阵一定能做正交对角化


3. 方程组与空间

3.1 线性方程组(Linear System)

常写成 \(Ax=b\)

3.2 增广矩阵(Augmented Matrix)

记作 \([A|b]\),就是把常数列并到系数矩阵后面。

判解个数最常用:

  • \(r(A)\ne r([A|b])\):无解
  • \(r(A)=r([A|b])=n\):唯一解
  • \(r(A)=r([A|b])<n\):无穷多解

3.3 齐次方程组(Homogeneous System)

右侧为 0,即 \(Ax=0\)
它的解集就是零空间

3.4 特解(Particular Solution)

非齐次方程组里任意一个具体解。

3.5 通解(General Solution)

所有解的总表达式。
常写成:

\[x=x_p+x_h \]

其中 \(x_p\)特解\(x_h\) 来自对应齐次方程组

3.6 子空间(Subspace)

一个集合如果满足:有零向量、加法封闭、数乘封闭,就是子空间。

3.7 子集(Subset)

子集只是“包含关系”,不要求加法封闭、数乘封闭。

3.8 张成(Span)

一组向量通过线性组合能拼出来的所有向量集合。

3.9 线性相关(Linear Dependence)

存在“不是全 0 的系数”,也能线性组合成零向量。

3.10 线性无关(Linear Independence)

只有“全 0 系数”才能组合成零向量。

3.11 基(Basis)

一组向量既线性无关,又能张成整个空间。

3.12 列空间(Column Space)

由矩阵列向量张成的空间,记作 \(C(A)\)

3.13 行空间(Row Space)

由矩阵行向量张成的空间,记作 \(R(A)\)

3.14 零空间(Null Space)

满足 \(Ax=0\) 的所有向量,记作 \(N(A)\)

核心公式:

\[\dim N(A)=n-r(A) \]


4. 特征值与分解

先说这一节到底在解决什么问题。

把矩阵 \(A\) 看成一个“变换机器”:输入向量,输出新向量。
通常向量方向会变,长度也会变,所以分析很麻烦。

特征值方法的核心作用是:

  1. 找到一批“方向不变”的向量(就是特征向量)。
  2. 在这些方向上,变换只剩“拉伸/压缩倍数”(就是特征值)。
  3. 把原问题改写到这个坐标系里,计算会简单很多(这就是对角化的价值)。

做题前提(充要条件版):

  1. 特征值问题可提出的充要条件\(A\) 是方阵(\(n\times n\))。
  2. 在实数范围有实特征值的充要条件:特征方程 \(|A-\lambda I|=0\) 在实数域有实根。
  3. 可对角化的充要条件\(A\)\(n\) 个线性无关特征向量。
  4. 可对角化的等价充要条件:全部特征值的几何重数之和等于 \(n\)
  5. 实矩阵可正交对角化的充要条件\(A^T=A\)(实对称)。
  6. SVD 存在的条件:对任意实矩阵 \(A\in\mathbb{R}^{m\times n}\) 都存在 SVD(即不需要额外前提)。

典型用途:

  1. 快速算 \(A^k\)
  2. 判断系统稳定性(看特征值大小和符号)。
  3. 做降维与数据压缩(和奇异值分解一起出现)。
  4. 做二次型化简(和第 5 节联动)。

4.1 特征值(Eigenvalue)

定义

若存在非零向量 \(v\) 使 \(Av=\lambda v\),则 \(\lambda\) 是特征值。

直观理解

  • 在向量方向不变的前提下,只发生了倍数变化。
  • \(|\lambda|>1\) 表示该方向被放大,\(|\lambda|<1\) 表示被缩小。

作用

  1. 判断变换在不同方向上的强弱。
  2. 支撑对角化和稳定性分析。

4.2 特征向量(Eigenvector)

定义

满足 \(Av=\lambda v\) 的非零向量 \(v\)

直观理解

  • 它是矩阵变换下“最干净”的方向。
  • 找到足够多线性无关特征向量,才可能顺利对角化。

常见坑

  1. \(v=0\) 不能算特征向量。
  2. 同一特征向量乘任意非零常数,仍是同一方向的特征向量。

4.3 特征方程(Characteristic Equation)

\[|A-\lambda I|=0 \]

作用

解它可得到全部特征值

实操顺序

  1. 写出 \(A-\lambda I\)
  2. 计算行列式得到多项式。
  3. 解多项式,得到全部特征值(含重根)。

4.4 代数重数(Algebraic Multiplicity)

定义

某个特征值在特征方程根里重复出现的次数。

一句话记忆

它是“方程层面”的重数。

4.5 几何重数(Geometric Multiplicity)

定义

特征值对应特征子空间的维数。

一句话记忆

它是“向量空间层面”的重数。

和代数重数关系(高频)

\[1 \le \text{几何重数} \le \text{代数重数} \]

该关系直接影响矩阵能否对角化。

4.6 对角化(Diagonalization)

存在可逆矩阵 \(P\) 使

\[P^{-1}AP=\Lambda \]

其中 \(\Lambda\) 是对角矩阵。

充要条件

矩阵 \(A\) 可对角化,当且仅当 \(A\)\(n\) 个线性无关特征向量。

等价充要条件

全部特征值的几何重数之和等于矩阵阶数 \(n\)

作用

  1. 把复杂乘法变成对角线元素乘法。
  2. 快速计算 \(A^k\)

\[A^k=P\Lambda^kP^{-1} \]

常见坑

有重根不代表不能对角化,关键看特征向量是否“凑够 \(n\) 个线性无关”。

4.7 正交对角化(Orthogonal Diagonalization)

存在正交矩阵 \(Q\) 使

\[Q^TAQ=\Lambda \]

充要条件(实矩阵)

\(A\) 可正交对角化,当且仅当 \(A\) 是对称矩阵(\(A^T=A\))。

作用

  1. 比一般对角化更稳定,因为 \(Q^{-1}=Q^T\)
  2. 在二次型、主轴变换里非常常见。

4.8 相似(Similarity)

定义

\(B=P^{-1}AP\),称 \(A\)\(B\) 相似。

不变量(做题常用)

相似矩阵有相同的特征值行列式

通俗理解

同一个线性变换,只是换了坐标系写法。

“相似”不是“近似”,而是“本质同一个变换,坐标表达不同”。

4.9 奇异值分解(Singular Value Decomposition, SVD)

\[A=U\Sigma V^T \]

其中 \(U,V\) 为正交矩阵,\(\Sigma\) 对角线是奇异值

存在条件

任意实矩阵都能做 SVD,不要求方阵(无额外前提)。

作用

  1. 降维(PCA 底层常用)。
  2. 压缩(只保留较大奇异值)。
  3. 去噪(过滤小奇异值对应噪声方向)。

和特征分解的关系

SVD 比特征分解适用面更广,因为它适用于非方阵。

4.10 奇异值(Singular Value)

定义

矩阵 \(A\) 的奇异值通常记作 \(\sigma_i\),来源是 \(A^TA\) 的特征值开根号。

公式

\[\sigma_i=\sqrt{\mu_i},\quad \mu_i \text{ 是 } A^TA \text{ 的特征值} \]

直观理解

奇异值描述矩阵在各主方向上的“拉伸强度”,值越大通常表示该方向信息越重要。


5. 二次型与数值方法

5.1 二次型(Quadratic Form)

\[f(x)=x^TAx \]

5.2 标准形(Canonical Form)

二次型化成若干平方项的和/差,便于判断性质。

5.3 惯性指数(Inertia)

正号平方项个数与负号平方项个数。

5.4 正定矩阵(Positive Definite Matrix)

对任意非零向量 \(x\),有 \(x^TAx>0\)

5.5 Cholesky 分解(Cholesky Decomposition)

对称正定矩阵可写为

\[A=LL^T \]

5.6 Jacobi 迭代(Jacobi Iteration)

\[x^{(k+1)}=D^{-1}(b-(L+U)x^{(k)}) \]

5.7 Gauss-Seidel 迭代(Gauss-Seidel Iteration)

\[x^{(k+1)}=(D+L)^{-1}(b-Ux^{(k)}) \]

5.8 收敛性(Convergence)

迭代结果会不会越来越接近真解。

5.9 谱半径(Spectral Radius)

记作 \(\rho(B)\),是矩阵特征值绝对值的最大值。


6. 几何变换

6.1 旋转矩阵(Rotation Matrix)

二维常见:

\[R_\theta=\begin{bmatrix}\cos\theta&-\sin\theta\\\sin\theta&\cos\theta\end{bmatrix} \]

6.2 平移(Translation)

平移本身不是线性变换。

6.3 齐次坐标(Homogeneous Coordinates)

向量末尾补一个 1,把旋转矩阵平移统一成矩阵乘法。

6.4 变换复合(Transformation Composition)

多个变换连乘时,右边矩阵先作用。


7. 关系链(做题定位最快)

  1. 矩阵 -> 行列式 -> 可逆性 -> 逆矩阵
  2. 矩阵 -> -> 线性方程组解结构 -> 零空间维数
  3. 矩阵 -> 特征值/特征向量 -> 对角化 -> 正交对角化
  4. \(A^TA\) -> 特征值 -> 奇异值 -> 奇异值分解
  5. 二次型 -> 正定矩阵/惯性指数 -> 标准形

8. 易混淆词(速记)

  1. 特征值 vs 奇异值
    • 特征值来自 \(A\)
    • 奇异值来自 \(A^TA\) 特征值开根号。
  2. 对角化 vs 正交对角化
    • 后者要求变换矩阵是正交矩阵。
  3. 行列式 vs
    • 行列式只对方阵定义,秩对任意矩阵定义。
  4. 线性相关 vs 线性无关
  5. 子空间 vs 子集

9. 考前 30 秒只看这 8 句

  1. 看可逆先看 \(\det(A)\)
  2. 看解个数先比 \(r(A)\)\(r([A|b])\)
  3. 零空间维数:\(\dim N(A)=n-r(A)\)
  4. 迹是特征值和,行列式是特征值积。
  5. 对称矩阵可正交对角化。
  6. 正交矩阵有 \(Q^{-1}=Q^T\)
  7. 奇异值来自 \(A^TA\)
  8. 变换连乘时右边先作用。