1. 向量与空间:从几何到抽象
1.1 向量的直观意义
- 向量最初来源于空间位移的概念:方向与长度的组合
- 在二维/三维空间中,向量 $\vec{v} = (v_1, v_2, v_3)$ 表示位置的变化。加法与数乘反映"平移与缩放"
几何上:
$$ \vec{u} + \vec{v} = \text{平行四边形对角线法则},\quad a\vec{v} = \text{沿方向拉伸或翻转} $$
抽象上,向量不局限于几何:
- 可以是多项式、函数、矩阵、序列等
- 只要满足:加法封闭、数乘封闭、存在零元与逆元等八条公理,即构成向量空间
1.2 向量空间的核心直觉
向量空间的关键是"线性结构",其核心思想为:
任意元素都可以由一组基向量线性组合得到
例如:在 $\mathbb{R}^3$ 中,$\vec{v} = a\vec{e}_1 + b\vec{e}_2 + c\vec{e}_3$
基向量定义了空间的"坐标系统";线性无关性确保基向量间无冗余
2. 矩阵:线性变换的代数形式
2.1 线性变换的几何意义
线性变换 $T:V\to W$ 满足:
$$ T(a\vec{u}+b\vec{v}) = aT(\vec{u}) + bT(\vec{v}) $$
它保持"线性结构"不变:原点保持原点,直线保持直线
在几何上:
- 缩放(Scaling)
- 旋转(Rotation)
- 反射(Reflection)
- 投影(Projection)
- 剪切(Shear)
2.2 矩阵作为算子
在基下,线性变换可写为矩阵乘法:
$$ T(\vec{x}) = A\vec{x} $$
矩阵 $A$ 捕捉了变换对每个基向量的作用
例如:二维旋转矩阵:
$$ R(\theta) = \begin{bmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix} $$
将所有向量绕原点旋转角度 $\theta$
2.3 行列式的几何直觉
行列式 $\det(A)$ 表示变换对体积(或面积)的缩放比
- 若 $|\det(A)| > 1$:放大
- 若 $|\det(A)| < 1$:压缩
- 若 $\det(A) = 0$:降维(空间被压扁)
符号(正/负)表示变换是否反转了空间的方向(如镜像)
3. 向量组与线性相关性
3.1 几何解释
线性相关:若某向量可由其他向量线性组合得到
$$ \exists a_1,\dots,a_n,\text{ 使 } a_1\vec{v}_1+\cdots+a_n\vec{v}_n=0,\text{ 且不全为0} $$
几何上:
- 在二维空间中,两向量共线 ⇒ 相关
- 在三维空间中,三个向量共面 ⇒ 相关
3.2 秩的本质
矩阵的秩(rank)是像空间维数,表示变换后空间的"维度保留程度"
$$ \text{rank}(A)=\dim(\text{Im}(A)) $$
- 秩 = 维度 ⇒ 变换是满射(onto)
- 秩 = 列数 ⇒ 变换是单射(injective)
秩揭示线性系统 $A\vec{x}=\vec{b}$ 的解结构:
- 唯一解:满秩方阵
- 无穷多解:秩亏
- 无解:$\vec{b}$ 不在列空间中
4. 特征值与特征向量:结构的核心
4.1 几何解释
若存在非零向量 $\vec{v}$ 使:
$$ A\vec{v} = \lambda\vec{v} $$
则 $\vec{v}$ 称为特征向量,$\lambda$ 为其特征值
直观理解:$A$ 作用于 $\vec{v}$ 时,仅改变其长度与方向,不改变方向
例:二维拉伸矩阵
$$ A = \begin{bmatrix}2 & 0 \\ 0 & 1\end{bmatrix} $$
沿 x 轴方向放大两倍,沿 y 轴方向保持不变。特征向量分别为 $\vec{e}_1, \vec{e}_2$,特征值为 2,1
4.2 对角化的直觉
若 $A$ 可对角化:
$$ A = P\Lambda P^{-1} $$
则存在基底使变换仅沿各方向独立缩放。$\Lambda$ 的对角元素为特征值,列向量为特征向量
几何意义:将复杂变换分解为一组独立方向的伸缩组合
4.3 对称矩阵的特殊性
对称矩阵($A^T=A$)具有:
- 实特征值
- 正交特征向量
- 可正交对角化
几何上,对称矩阵对应"方向一致的拉伸",无旋转分量。这是主成分分析(PCA)的线性代数基础
5. 线性代数的三个核心空间
| 空间 | 定义 | 几何意义 |
|---|---|---|
| 列空间(Column Space) | 由列向量张成的子空间 | 变换的像空间(输出) |
| 行空间(Row Space) | 由行向量张成的子空间 | 约束的方向空间 |
| 零空间(Null Space) | $A\vec{x}=0$ 的解集 | 被压缩为零的方向 |
三个空间之间的关系:
$$ \dim(\text{Row}) = \dim(\text{Col}) = \text{rank}(A),\quad \dim(\text{Null}) = n - \text{rank}(A) $$
这即为秩-零化度定理(Rank–Nullity Theorem)
6. 正交性与投影
6.1 内积与正交
内积:$\langle u,v\rangle = u^T v$
若 $\langle u,v\rangle = 0$,则 $u,v$ 正交
几何上:$\langle u,v\rangle = |u||v|\cos\theta$,衡量"方向相似度"
6.2 正交投影
给定子空间 $S=\text{span}\{u_1,\dots,u_k\}$,向量 $v$ 在 $S$ 上的投影为:
$$ P_S v = U(U^T U)^{-1}U^T v,\quad U=[u_1,\dots,u_k] $$
若 $U$ 正交归一化,则简化为 $P_S = UU^T$
直观:投影是"垂足"的运算,代表最小平方距离
这构成最小二乘法(Least Squares)的几何基础
7. 奇异值分解(SVD):统一视角
SVD 将任意矩阵分解为:
$$ A = U\Sigma V^T $$
其中:
- $U,V$:正交矩阵(旋转/反射)
- $\Sigma$:对角矩阵(拉伸)
几何意义:任意线性变换 = 旋转 → 拉伸 → 旋转
SVD 同时揭示:
- 列空间、行空间、零空间的几何结构
- 近似与降维(如 PCA)中最优低秩逼近
8. 线性代数的直观总结
| 概念 | 几何解释 | 核心思想 |
|---|---|---|
| 向量 | 方向与长度 | 空间的"点"与"方向" |
| 线性变换 | 空间映射 | 保持直线与原点结构 |
| 矩阵乘法 | 基变换与组合 | 累积作用、变换叠加 |
| 行列式 | 体积缩放 | 判断可逆性与方向保持 |
| 特征值 | 不变方向的伸缩因子 | 结构对称与动力平衡 |
| 正交 | 垂直性与独立性 | 最小干扰与投影 |
| SVD | 通用分解 | 任意变换的"旋转-拉伸-旋转"结构 |
一句话总结: 线性代数是"线性关系的语言",其直观几何意义在于——所有复杂的变化都可以理解为在不同方向上进行的拉伸、旋转与投影的组合