(离散型与连续型)
数学
概率论与数理统计
离散型随机变量及其概率分布
如果随机变量 $X$ 只可能取有限个或可列无限个值 $x_1, x_2, \cdots$ ,则称 $X$ 为离散型随机变量,称为 $X$ 的分布列、分布律或概率分布,记为 $X \sim p_i$ ,概率分布通常用表格形式或矩阵形式表示,即:
X | $x_1$ | $x_2$ | $\cdots$ |
---|---|---|---|
P | $p_1$ | $p_2$ | $\cdots1$ |
数列 ${p_i }(i = 1, 2, \cdots)$ 是离散型随机变量的概率分布的充要条件:$p_i \geq 0(i = 1, 2, \cdots)$ ,且 $\sum\limits_ip_i = 1$ .
设离散型随机变量 $X$ 的概率分布为 $P{X = x_i} = p_i, i = 1, 2, \cdots$ ,则 $X$ 的分布函数:
$$ F(x) = P{X \leq x} = \sum\limits_{x_i \leq x}P{X = x_i}, \ P{X = x_i} = P{X \leq x_i} - P{X < x_i} = F(x_i) - F(x_i - 0) $$
并且对实数轴上的任一集合 $B$ ,有:
$$ P{X \in B} = \sum\limits_{x_i \leq x}P{X = x_i}, $$
特别地,$P{a < X \leq b} = P{x \leq b} - P{X \leq a} = F(b) - F(a).$
连续型随机变量及其概率密度
如果随机变量 $X$ 的分布函数可以表示为:$F(x) = \int^x_{-\infty}f(t)dt(x \in R),$
其中 $f(x)$ 是非负可积函数,则称 $X$ 为连续型随机变量,称 $f(x)$ 为 $X$ 为连续型随机变量,称 $f(x)$ 为 $X$ 的概率密度函数,简称概率密度,记为 $X \sim f(x)$.
$f(x)$ 为某一随机变量 $X$ 的概率密度的充分必要条件:$f(x) \geq 0$ ,且 $\int^{+\infty}_{-\infty}f(x)dx = 1$ (由此可知,在保证非负的条件下,改变 $f(x)$ 有限个点的值,$f(x)$ 仍然是概率密度).
设 $X$ 为连续型随机变量,$X \sim f(x)$ ,则对任意实数 $c$ ,有 $P{X = c} = 0$ ;对实数轴上任一集合 $B$ ,有 $P{X \in B} = \int_Bf(x)dx.$
特别地,$P{a < X < b} = P{a \leq X < b} = P{a < X \leq b} = P{a \leq X \leq b} = \int^b_af(x)dx = F(b) - F(a)$
常见的随机变量分布类型
离散型
- 0-1 分布 $B(1, p)(Ber - E_1)$
如果 $X$ 的概率分布为 $X \sim \begin{pmatrix}1 & 0 \ p & 1-p\end{pmatrix},$ 即 $P{X = 1} = p, P{X = 0} = 1 - p$ ,则称 $X$ 服从参数为 $p$ 的 0-1分布,记为 $X \sim B(1, p)(0 < p < 1)$
- 二项分布 $B(n, p)(Ber - E_n)$
如果 $X$ 的概率分布为 $P{X = k} = C^k_np^k(1 - p)^{n - k}(k = 0, 1, \cdots, n; 0 < p < 1)$ ,则称 $X$ 服从参数为 $(n, p)$ 的二项分布,记为 $X \sim B(n, p)$
- 泊松分布 $P(\lambda)$
如果 $X$ 的概率分布为:$P{X = k} = \frac{\lambda^k}{k!}e^{-\lambda}(k = 0, 1, \cdots; \lambda > 0)$ ,则称 $X$ 服从参数为 $\lambda$ 的泊松分布,记为 $X \sim P(\lambda)$.
- 几何分布 $G(p)(Ber - E_{\infty})$
如果 $X$ 的概率分布为 $P{X = k} = (1 - p)^{k - 1}p(k = 1, 2, \cdots; 0 < p < 1)$ ,则称 $X$ 服从参数为 $p$ 的几何分布,记为 $X \sim G(p)$.
- 超几何分布 $H(n, N, M)$
如果 $X$ 的概率分布为 $P{X = k} = \frac{C^k_MC^{n-k}_{N - M}}{C^n_N}(max{0, n - N + M} \leq k \leq min{M, n}; M, N, n$ 为正整数且 $M \leq N, n \leq N, k$ 为整数),则称 $X$ 服从参数为 $(n, N, M)$ 的超几何分布,记为 $X \sim H(n, N, M)$
连续型
- 均匀分布 $U(a, b)$
如果随机变量 $X$ 的概率密度和分布函数分别为:
$$
f(x) =
\begin{cases}
\frac{1}{b - a}, a < x < b, \
0, 其他,
\end{cases}
F(x) =
\begin{cases}
0, x < a, \
\frac{x - a}{b - a}, a \leq x < b, \
1, x \geq b,
\end{cases}
$$
则称 $X$ 在区间 $(a, b)$ 上服从均匀分布,记为 $X \sim U(a, b)$.
- 指数分布 $E(\lambda)$
如果 $X$ 的概率密度和分布函数分别为:
$$ f(x) = \begin{cases} \lambda e^{-\lambda x}, x > 0,\ 0, 其他 \end{cases} F(x) = \begin{cases} 1 - e^{-\lambda x}, x \geq 0, \ 0, x < 0 \end{cases}(\lambda > 0) $$
- 正态分布 $N(\mu, \sigma^2)$
如果 $X$ 的概率密度为:$f(x) = \frac{1}{\sqrt{2 \pi}\sigma}e^{-\frac{1}{2}(\frac{x - \mu}{\sigma})^2}(-\infty < x < +\infty)$ ,其中 $-\infty < \mu < +\infty, \sigma > 0$ ,则称 $X$ 服从参数为 $(\mu, \sigma^2)$ 的正态分布或称 $X$ 为正态变量,记为 $X \sim N(\mu, \sigma^2)$ ,此时 $f(x)$ 的图形关于直线 $x = \mu$ 对称,即 $f(\mu - x) = f(\mu + x)$ ,并在 $x = \mu$ 处有唯一最大值 $f(\mu) = \frac{1}{\sqrt{2\pi}\sigma}$.
称 $\mu = 0, \sigma = 1$ 时的正态分布 $N(0, 1)$ 为标准正态分布,通常记标准正态分布的概率密度为 $\Phi(x) = \frac{1}{\sqrt{2\pi}}\int^x_{-\infty}e^{\frac{t^2}{2}}dt.$
显然 $\varphi(x)$ 为偶函数,则:$\Phi(0) = \frac{1}{2}, \Phi(-x) = 1- \Phi(x).$
若 $X \sim N(0, 1), P{X > \mu_a} = \alpha$ ,则称 $\mu_a$ 为标准正态分布的上侧 $\alpha$ 分位数(上 $\alpha$ 分位点).
如果 $X \sim N(\mu, \sigma^2)$ ,则:
$$ F(x) = P{X \leq x} = \Phi(\frac{x - \mu}{\sigma}), \ F(\mu - x) + F(\mu + x) = 1, \ P{a < X < b} = \Phi(\frac{b - \mu}{\sigma}) - \Phi(\frac{a - \mu}{\sigma}), \ aX + b \sim N(a\mu + b, a^2\sigma^2)(a \neq 0). $$