数学推导:高斯积分与正态分布归一化系数
我们要解决的核心问题是计算著名的 高斯积分 (Gaussian Integral):
$$
I = \int_{-\infty}^{+\infty} e^{-x^2} dx
$$
这是一个经典的数学难题,因为函数 $e^{-x^2}$ 的原函数不是初等函数(即无法通过常规积分法则直接写出)。
解决方法是使用 泊松积分技巧 (Poisson Integral):通过“升维打击”,将一重积分转化为二重极坐标积分来求解。
1. 构造平方 (The Square Trick)
既然无法直接计算 $I$,我们尝试计算 $I^2$。
引入一个独立的变量 $y$,其积分值与 $x$ 相同:
$$
I^2 = \left( \int_{-\infty}^{+\infty} e^{-x^2} dx \right) \left( \int_{-\infty}^{+\infty} e^{-y^2} dy \right)
$$
利用线性性质,将其合并为二重积分:
$$
I^2 = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} e^{-(x^2 + y^2)} dx dy
$$
数学意义:
此时,问题从计算“平面曲线下的面积”(1D),变成了计算“旋转曲面下的体积”(2D)。
2. 极坐标变换 (Polar Coordinates Transformation)
这是解题的关键一步。我们将笛卡尔坐标系 $(x, y)$ 变换为极坐标系 $(r, \theta)$。
变换关系:
- $x = r \cos \theta$
- $y = r \sin \theta$
- $x^2 + y^2 = r^2$
- 面积微元 (Jacobian):$dx dy \rightarrow r dr d\theta$ (注意:这里多了一个 $r$)
积分区域:
- 全平面对应为:半径 $r \in [0, +\infty)$,角度 $\theta \in [0, 2\pi]$。
代入积分式:
$$
I^2 = \int_{0}^{2\pi} \int_{0}^{+\infty} e^{-r^2} \cdot r dr d\theta
$$
由于被积函数中 $r$ 和 $\theta$ 是分离的,我们可以将二重积分拆解为两个单重积分的乘积:
$$
I^2 = \left( \int_{0}^{2\pi} d\theta \right) \left( \int_{0}^{+\infty} e^{-r^2} r dr \right)
$$
3. 分步计算
第一部分:角度积分
这是常数积分,计算非常简单:
$$
\int_{0}^{2\pi} d\theta = [\theta]_{0}^{2\pi} = 2\pi
$$
第二部分:半径积分
计算 $J = \int_{0}^{+\infty} e^{-r^2} r dr$。
使用 换元法 (u-substitution):
- 令 $u = r^2$,则 $du = 2r dr$,即 $r dr = \frac{1}{2} du$。
- 当 $r=0$ 时,$u=0$;当 $r \to \infty$ 时,$u \to \infty$。
代入计算:
$$
\begin{aligned}
J &= \int_{0}^{+\infty} e^{-u} \cdot \frac{1}{2} du \
&= \frac{1}{2} \left[ -e^{-u} \right]_{0}^{+\infty} \
&= \frac{1}{2} (0 - (-1)) \
&= \frac{1}{2}
\end{aligned}
$$
4. 汇总结果
回到 $I^2$ 的算式:
$$
\begin{aligned}
I^2 &= (\text{角度部分}) \times (\text{半径部分}) \
&= 2\pi \times \frac{1}{2} \
&= \pi
\end{aligned}
$$
因为被积函数 $e^{-x^2}$ 始终大于 0,积分结果必为正数,开方取正根:
$$
I = \int_{-\infty}^{+\infty} e^{-x^2} dx = \sqrt{\pi}
$$
5. 关联:为什么正态分布是 $\sqrt{2\pi}$?
标准正态分布的概率密度公式中,指数项通常带有系数 $-\frac{1}{2}$:
$$
\text{Target} = \int_{-\infty}^{+\infty} e^{-\frac{1}{2}x^2} dx
$$
我们需要利用刚才推导出的结论 $I = \sqrt{\pi}$ 来计算这个变体。
换元计算:
令 $t = \frac{x}{\sqrt{2}}$,则 $x = \sqrt{2}t$,且 $dx = \sqrt{2} dt$。
$$
\begin{aligned}
\int_{-\infty}^{+\infty} e^{-\left(\frac{x}{\sqrt{2}}\right)^2} dx &= \int_{-\infty}^{+\infty} e^{-t^2} \cdot \sqrt{2} dt \
&= \sqrt{2} \underbrace{\int_{-\infty}^{+\infty} e^{-t^2} dt}_{I=\sqrt{\pi}} \
&= \sqrt{2} \cdot \sqrt{\pi} \
&= \sqrt{2\pi}
\end{aligned}
$$
结论
正是因为全积分 $\int_{-\infty}^{+\infty} e^{-\frac{1}{2}x^2} dx = \sqrt{2\pi}$,为了满足概率论公理(即总概率必须等于 1),概率密度函数的前面必须除以这个结果作为归一化系数。
这就是正态分布公式中 $\frac{1}{\sqrt{2\pi}}$ 的由来:
$$
f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}x^2}
$$