🥥Python统计推断
Python | 数学 | 统计 | 隐马尔可夫 | 蒙特卡洛方法 | 降维 | 假设检验 | 统计估计 | 卡尔曼滤波器
数学知识
在概率论中,我们考虑一个样本空间,它是所有可能结果的集合,以及它的具有-代数结构的子集的集合,其中的元素称为事件。
定义 1.1(随机变量)。– 真正的随机变量是从到的(可测量的)应用:
定义 1.2(离散随机变量)。– 如果随机变量$X$取其值在的子集中,最多可数,则称其为离散变量。 如果,其中,表示这组值,则$X$的概率分布由以下序列表征:
表示等于元素的概率。 这些值使得且。
这导致我们得到随机变量$X$属于区间的概率。 它由以下给出:
对于,随机变量的累积分布函数 (cdf) 定义为:
它是一个单调递增函数,其中和。 它的图形是一个阶梯函数,跳跃位于幅度为。
定义 1.3(分位数)。– 第个分位数,与给定的累积函数相关,写为:
其中从 1 到 。因此,分位数的数量是。
分位数是将概率范围划分为等概率 1 的 个区间的限制。例如,2-分位数是中位数。
更具体地说,我们有:
定义 1.4(中值)。– 随机变量 的中值是值 ,使得累积函数满足 。
以下程序执行高斯分布的 分位数。 概率密度下的每个面积等于 。
from numpy import linspace, arange
from scipy.stats import norm
from matplotlib import pyplot as plt
x = linspace(-3,3,100); y = norm.pdf(x); plt.clf(); plt.plot(x,y)
q = 5; Qqi = arange(1,q)/q; quantiles = norm.ppf(Qqi)
plt.hold(’on’)
for iq in range(q-1):
print(’%i-th of the %i-quantiles is %4.3e’%(iq+1,q,quantiles[iq]))
plt.plot([quantiles[iq],quantiles[iq]],[0.0,norm.pdf(quantiles[iq])],’:’)
plt.hold(’off’);plt.title(’eachareaisequalto%4.2f’%(1.0/q));
plt.show();定义 1.5(两个离散随机变量)。– 令 为两个离散随机变量,分别具有一组值 和 。 联合概率分布的特征是正值序列:
具有和。
这个定义可以很容易地扩展到有限数量的随机变量的情况。
概率 1.1(边际概率分布)。——令 是两个离散的随机变量,它们的联合概率分布为 。 和 各自的边际概率分布写为:
定义 1.6(连续随机变量)。– 如果随机变量的值属于 并且对于任何实数 和 , 属于区间 的概率由下式给出,则称该随机变量是连续的 :
其中 是一个必须为正或等于 0 的函数,这样 。 称为 的概率密度函数 (pdf)。
对于任何 ,随机变量 的累积分布函数 (cdf) 定义为:
它是一个单调递增函数,其中 和 。 请注意, 也表示 对 的导数。
统计推理
隐马尔可夫模型推理
蒙特卡罗方法
Last updated
Was this helpful?