原文地址:https://www.cnblogs.com/ryuo-ou/p/19873458 同步说明:该文已完整同步到站内博客,便于统一检索和阅读。
1. 基础对象
1.1 标量(Scalar)
就是一个普通数字,比如 2、-1、3.14。
1.2 向量(Vector)
一串有顺序的数,可以理解为“一个点的位置”或“一个方向”。
例如 \(x=(x_1,x_2,\dots,x_n)^T\)。
1.3 矩阵(Matrix)
按行列排好的数字表。
做题里最常见作用:把一个向量变成另一个向量。
1.4 维数(Dimension)
一个空间里“独立方向”的个数。
1.5 线性变换(Linear Transformation)
满足“先加后变换”和“先数乘后变换”的规则:
通俗说:它不会把直线扭成弯线。
2. 矩阵运算
2.1 转置(Transpose)
把矩阵行和列交换,记作 \(A^T\)。
2.2 逆矩阵(Inverse Matrix)
矩阵版“倒数”,记作 \(A^{-1}\)。满足 \(AA^{-1}=A^{-1}A=I\)。
2.3 单位矩阵(Identity Matrix)
记作 \(I\),对角线是 1,其余是 0。相当于矩阵里的“数字 1”。
2.4 行列式(Determinant)
记作 \(\det(A)\)。
最实用结论:\(\det(A)=0\) 时,逆矩阵不存在。
2.5 秩(Rank)
记作 \(r(A)\),表示矩阵里最多有多少个“互不重复信息”的行或列。
2.6 迹(Trace)
记作 \(\operatorname{tr}(A)\),就是主对角线求和。
2.7 正交矩阵(Orthogonal Matrix)
满足 \(Q^TQ=I\)。
常背性质:\(Q^{-1}=Q^T\),\(\det(Q)=\pm1\)。
2.8 对称矩阵(Symmetric Matrix)
满足 \(A^T=A\)。
实对称矩阵一定能做正交对角化。
3. 方程组与空间
3.1 线性方程组(Linear System)
常写成 \(Ax=b\)。
3.2 增广矩阵(Augmented Matrix)
记作 \([A|b]\),就是把常数列并到系数矩阵后面。
判解个数最常用:
- \(r(A)\ne r([A|b])\):无解
- \(r(A)=r([A|b])=n\):唯一解
- \(r(A)=r([A|b])<n\):无穷多解
3.3 齐次方程组(Homogeneous System)
右侧为 0,即 \(Ax=0\)。
它的解集就是零空间。
3.4 特解(Particular Solution)
非齐次方程组里任意一个具体解。
3.5 通解(General Solution)
所有解的总表达式。
常写成:
其中 \(x_p\) 是特解,\(x_h\) 来自对应齐次方程组。
3.6 子空间(Subspace)
一个集合如果满足:有零向量、加法封闭、数乘封闭,就是子空间。
3.7 子集(Subset)
子集只是“包含关系”,不要求加法封闭、数乘封闭。
3.8 张成(Span)
一组向量通过线性组合能拼出来的所有向量集合。
3.9 线性相关(Linear Dependence)
存在“不是全 0 的系数”,也能线性组合成零向量。
3.10 线性无关(Linear Independence)
只有“全 0 系数”才能组合成零向量。
3.11 基(Basis)
3.12 列空间(Column Space)
由矩阵列向量张成的空间,记作 \(C(A)\)。
3.13 行空间(Row Space)
由矩阵行向量张成的空间,记作 \(R(A)\)。
3.14 零空间(Null Space)
满足 \(Ax=0\) 的所有向量,记作 \(N(A)\)。
核心公式:
4. 特征值与分解
先说这一节到底在解决什么问题。
把矩阵 \(A\) 看成一个“变换机器”:输入向量,输出新向量。
通常向量方向会变,长度也会变,所以分析很麻烦。
特征值方法的核心作用是:
做题前提(充要条件版):
- 特征值问题可提出的充要条件:\(A\) 是方阵(\(n\times n\))。
- 在实数范围有实特征值的充要条件:特征方程 \(|A-\lambda I|=0\) 在实数域有实根。
- 可对角化的充要条件:\(A\) 有 \(n\) 个线性无关特征向量。
- 可对角化的等价充要条件:全部特征值的几何重数之和等于 \(n\)。
- 实矩阵可正交对角化的充要条件:\(A^T=A\)(实对称)。
- SVD 存在的条件:对任意实矩阵 \(A\in\mathbb{R}^{m\times n}\) 都存在 SVD(即不需要额外前提)。
典型用途:
- 快速算 \(A^k\)。
- 判断系统稳定性(看特征值大小和符号)。
- 做降维与数据压缩(和奇异值分解一起出现)。
- 做二次型化简(和第 5 节联动)。
4.1 特征值(Eigenvalue)
定义
若存在非零向量 \(v\) 使 \(Av=\lambda v\),则 \(\lambda\) 是特征值。
直观理解
- 在向量方向不变的前提下,只发生了倍数变化。
- \(|\lambda|>1\) 表示该方向被放大,\(|\lambda|<1\) 表示被缩小。
作用
- 判断变换在不同方向上的强弱。
- 支撑对角化和稳定性分析。
4.2 特征向量(Eigenvector)
定义
满足 \(Av=\lambda v\) 的非零向量 \(v\)。
直观理解
- 它是矩阵变换下“最干净”的方向。
- 找到足够多线性无关特征向量,才可能顺利对角化。
常见坑
- \(v=0\) 不能算特征向量。
- 同一特征向量乘任意非零常数,仍是同一方向的特征向量。
4.3 特征方程(Characteristic Equation)
作用
解它可得到全部特征值。
实操顺序
- 写出 \(A-\lambda I\)。
- 计算行列式得到多项式。
- 解多项式,得到全部特征值(含重根)。
4.4 代数重数(Algebraic Multiplicity)
定义
某个特征值在特征方程根里重复出现的次数。
一句话记忆
它是“方程层面”的重数。
4.5 几何重数(Geometric Multiplicity)
定义
该特征值对应特征子空间的维数。
一句话记忆
它是“向量空间层面”的重数。
和代数重数关系(高频)
该关系直接影响矩阵能否对角化。
4.6 对角化(Diagonalization)
存在可逆矩阵 \(P\) 使
其中 \(\Lambda\) 是对角矩阵。
充要条件
矩阵 \(A\) 可对角化,当且仅当 \(A\) 有 \(n\) 个线性无关特征向量。
等价充要条件
全部特征值的几何重数之和等于矩阵阶数 \(n\)。
作用
- 把复杂乘法变成对角线元素乘法。
- 快速计算 \(A^k\):
常见坑
有重根不代表不能对角化,关键看特征向量是否“凑够 \(n\) 个线性无关”。
4.7 正交对角化(Orthogonal Diagonalization)
存在正交矩阵 \(Q\) 使
充要条件(实矩阵)
\(A\) 可正交对角化,当且仅当 \(A\) 是对称矩阵(\(A^T=A\))。
作用
- 比一般对角化更稳定,因为 \(Q^{-1}=Q^T\)。
- 在二次型、主轴变换里非常常见。
4.8 相似(Similarity)
定义
若 \(B=P^{-1}AP\),称 \(A\) 与 \(B\) 相似。
不变量(做题常用)
通俗理解
同一个线性变换,只是换了坐标系写法。
“相似”不是“近似”,而是“本质同一个变换,坐标表达不同”。
4.9 奇异值分解(Singular Value Decomposition, SVD)
其中 \(U,V\) 为正交矩阵,\(\Sigma\) 对角线是奇异值。
存在条件
任意实矩阵都能做 SVD,不要求方阵(无额外前提)。
作用
- 降维(PCA 底层常用)。
- 压缩(只保留较大奇异值)。
- 去噪(过滤小奇异值对应噪声方向)。
和特征分解的关系
SVD 比特征分解适用面更广,因为它适用于非方阵。
4.10 奇异值(Singular Value)
定义
矩阵 \(A\) 的奇异值通常记作 \(\sigma_i\),来源是 \(A^TA\) 的特征值开根号。
公式
直观理解
奇异值描述矩阵在各主方向上的“拉伸强度”,值越大通常表示该方向信息越重要。
5. 二次型与数值方法
5.1 二次型(Quadratic Form)
5.2 标准形(Canonical Form)
把二次型化成若干平方项的和/差,便于判断性质。
5.3 惯性指数(Inertia)
正号平方项个数与负号平方项个数。
5.4 正定矩阵(Positive Definite Matrix)
对任意非零向量 \(x\),有 \(x^TAx>0\)。
5.5 Cholesky 分解(Cholesky Decomposition)
对称正定矩阵可写为
5.6 Jacobi 迭代(Jacobi Iteration)
5.7 Gauss-Seidel 迭代(Gauss-Seidel Iteration)
5.8 收敛性(Convergence)
迭代结果会不会越来越接近真解。
5.9 谱半径(Spectral Radius)
记作 \(\rho(B)\),是矩阵特征值绝对值的最大值。
6. 几何变换
6.1 旋转矩阵(Rotation Matrix)
二维常见:
6.2 平移(Translation)
平移本身不是线性变换。
6.3 齐次坐标(Homogeneous Coordinates)
6.4 变换复合(Transformation Composition)
多个变换连乘时,右边矩阵先作用。
7. 关系链(做题定位最快)
- 矩阵 -> 行列式 -> 可逆性 -> 逆矩阵
- 矩阵 -> 秩 -> 线性方程组解结构 -> 零空间维数
- 矩阵 -> 特征值/特征向量 -> 对角化 -> 正交对角化
- \(A^TA\) -> 特征值 -> 奇异值 -> 奇异值分解
- 二次型 -> 正定矩阵/惯性指数 -> 标准形
8. 易混淆词(速记)
- 特征值 vs 奇异值
- 特征值来自 \(A\)。
- 奇异值来自 \(A^TA\) 特征值开根号。
- 对角化 vs 正交对角化
- 后者要求变换矩阵是正交矩阵。
- 行列式 vs 秩
- 行列式只对方阵定义,秩对任意矩阵定义。
- 线性相关 vs 线性无关
- 子空间 vs 子集
9. 考前 30 秒只看这 8 句
- 看可逆先看 \(\det(A)\)。
- 看解个数先比 \(r(A)\) 和 \(r([A|b])\)。
- 零空间维数:\(\dim N(A)=n-r(A)\)。
- 迹是特征值和,行列式是特征值积。
- 对称矩阵可正交对角化。
- 正交矩阵有 \(Q^{-1}=Q^T\)。
- 奇异值来自 \(A^TA\)。
- 变换连乘时右边先作用。