Normal distribution
本blog总结单变量正态分布以及多元正态分布和他们的性质。
单变量正态分布
概率密度函数:
期望$\mu$和方差$\sigma^2$:
多元正态分布
概率密度函数:
- $x=[x_1,x_2,…,x_d]^T$ 是d维向量
- $\mu=[\mu_1,\mu_2,…,\mu_d]^T$是d维均值向量
- $\Sigma$是dxd维协方差矩阵
$
\mu=E\{x\} \\
\Sigma=E\{(x-\mu)(x-\mu)^T\}
$
$\mu$,$\Sigma$分别是向量$x$和矩阵$(x-\mu)(x-\mu)^T$的期望,若$x_i$是$x$的第$i$个个分量,$\mu_i$是$\mu$的第$i$个分量,$\sigma_{ij}$是$\Sigma$的第$i,j$个元素,则
其中,$p(x_i)$为边缘分布
而
协方差矩阵总是正定or半正定的矩阵,可以表示为
多元分布性质
多元正态分布被均值向量$\mu$和协方差矩阵$\Sigma$所完全决定。
等密度点的轨迹为以超椭球面,区域中心由均值向量$\mu$决定,区域的大小由协方差矩阵$\Sigma$决定。当指数项为常数时,构成等密度点:
该式子的解是一个超椭球面,且它的主轴方向由$\Sigma$阵的特征向量决定,主轴长度与相应的协方差矩阵$\Sigma$的特征值成正比。
称为由$x$到$\mu$的Mahalanobis距离(马氏距离)的平方,对应于Mahalanobis距离为$\gamma$的超椭圆球体积是
其中$V_d$是$d$维单位超球体的体积,
对于给定的维数,样本离散度直接随$|\Sigma|^{1/2}$而变。
不相关性=独立性
- 不相关:$E\{x_ix_j\}=E\{x_i\}E\{x-j\}$
- 独立的:$p\{x_ix_j\}=p\{x_i\}p\{x_j\}$
独立性比不相关性条件更强,而在多元正态分布中,两者等价。在正态分布中,变量互不相关,则一定独立。
推论:如果多元正态随机向量的协方差矩阵是对角阵,则x的分量是相互独立的正态分布随机变量。
边缘分布和条件分布的正态性
以二元正态分布为例,
- 向量$x=[x_1,x_2]^T$
- 均值$\mu=[\mu_1,\mu_2]^T$
- 协方差矩阵$\Sigma=\left[\begin{matrix}\sigma_{11}^2&\sigma_{12}^2\\\sigma_{21}^2&\sigma_{22}^2\end{matrix}\right]$
线性变换的正态性
对于多元正态随机变量$x$,无论是线性变化$y=Ax$还是线性组合$y=\alpha^Tx$,正态分布依然是正态分布。