🥥Python统计推断
Python | 数学 | 统计 | 隐马尔可夫 | 蒙特卡洛方法 | 降维 | 假设检验 | 统计估计 | 卡尔曼滤波器
数学知识
在概率论中,我们考虑一个样本空间,它是所有可能结果的集合,以及它的具有-代数结构的子集的集合,其中的元素称为事件。
定义 1.1(随机变量)。– 真正的随机变量是从到的(可测量的)应用:
定义 1.2(离散随机变量)。– 如果随机变量$X$取其值在的子集中,最多可数,则称其为离散变量。 如果,其中,表示这组值,则$X$的概率分布由以下序列表征:
表示等于元素的概率。 这些值使得且。
这导致我们得到随机变量$X$属于区间的概率。 它由以下给出:
对于,随机变量的累积分布函数 (cdf) 定义为:
它是一个单调递增函数,其中和。 它的图形是一个阶梯函数,跳跃位于幅度为。
定义 1.3(分位数)。– 第个分位数,与给定的累积函数相关,写为:
其中从 1 到 。因此,分位数的数量是。
分位数是将概率范围划分为等概率 1 的 个区间的限制。例如,2-分位数是中位数。
更具体地说,我们有:
定义 1.4(中值)。– 随机变量 的中值是值 ,使得累积函数满足 。
以下程序执行高斯分布的 分位数。 概率密度下的每个面积等于 。
定义 1.5(两个离散随机变量)。– 令 为两个离散随机变量,分别具有一组值 和 。 联合概率分布的特征是正值序列:
具有和。
这个定义可以很容易地扩展到有限数量的随机变量的情况。
概率 1.1(边际概率分布)。——令 是两个离散的随机变量,它们的联合概率分布为 。 和 各自的边际概率分布写为:
定义 1.6(连续随机变量)。– 如果随机变量的值属于 并且对于任何实数 和 , 属于区间 的概率由下式给出,则称该随机变量是连续的 :
其中 是一个必须为正或等于 0 的函数,这样 。 称为 的概率密度函数 (pdf)。
对于任何 ,随机变量 的累积分布函数 (cdf) 定义为:
它是一个单调递增函数,其中 和 。 请注意, 也表示 对 的导数。
统计推理
隐马尔可夫模型推理
蒙特卡罗方法
Last updated
Was this helpful?