🧄R和Python概率分布统计和Python验证独立性和平稳性时间序列
R | 统计方法 | 概率密度函数(PDF) | Python | 独立性和平稳性 | 时间序列 | 概率分布 | Matplotlib | scipy | NumPy
R概率分布和统计
R 基础知识 | 汇总统计数据 | 图形显示 | 概率基础知识 | 概率规则 | 条件概率 | 后验概率和贝叶斯 | 可靠性 | 离散分布介绍
几何分布
概率密度函数
概率密度函数 (pdf) 定义为
P(X=x)=qx−1p;x=1,2,3,…
这是在第 x 次试验中第一次成功的概率。
几何随机变量是离散的,因为它的值是整数,并且是无限的,因为从理论上讲,我们可以永远等待成功。
我们可以很容易地检查 ∑xP(X=x)=1
x∑P(X=x)=p+qp+q2p+q3p+⋯=p(1+q+q2+q3+⋯)=p×1−q1=1
记住比率 q<1 的无限几何级数之和是
1+q+q2+q3+⋯=1−q1=p1
R代码计算概率密度函数
R 中提供了函数来计算和绘制 pdf。 对于几何分布,我们在缩写名称 geom 前加上“d”,用于 pdf; 函数 dgeom 连同参数 p,即成功的概率,作为参数来计算概率。
例 3 中的结果,找到了第一个缺陷出现在第五个缺陷中的概率,可以在 R 中检查。
dgeom (x = 4, prob = 0.03)
或
dgeom (4, 0.03)
得出
0.02655878
如果我们绘制 pdf,就会出现更清晰的画面。 R代码
par (mfrow = c(2, 2))
x <- 0:4
plot(x+1, dgeom(x, prob = 0.95),
xlab = "X = Number of trials", ylab = "P(X=x)",
type = "h", main = "First workstation, p = 0.95",
font.main = 1)
x <- 0:9
plot(x+1, dgeom(x, prob = 0.5),
xlab = "X = Number of trials", ylab = "P(X=x)",
type = "h", main = "First head, p = 0.5",
font.main = 1)
x <- 0:19
plot(x+1, dgeom(x, prob = 0.2),
xlab = "X = Number of trials", ylab = "P(X=x)",
type = "h", main = "First defective, p = 0.2",
font.main = 1)
x <- seq(0, 400, 50)
plot(x+1, dgeom(x, prob = 0.01),
xlab = "X = Number of trials", ylab = "P(X=x)",
type = "h", main = "First bit in error,
p = 0.01", font.main = 1)
二项分布 | 超几何分布 | 泊松分布 | 抽样检验方案 | 连续分布 | 指数分布 | 队列 | 正态分布 | 过程控制 | 马尔可夫和切比雪夫不等式
Python概率和统计
基本概念 | 事件操作 | 全概率定律 | 贝叶定理 | 重复实验 | 随机变量,离散随机变量的分布 | 分配功能 | 概率密度函数 | 期望值、众数、中位数 | 矩、方差、标准差
几何分布
import matplotlib.pyplot as plt
def probability_to_occur_at(attempt, probability):
return (1-p)**(attempt - 1) * probability
p = 0.2
attempt = 3
attempts_to_show = range(21)[1:]
print('probability that the event will occur on the 8th try: ', probability_to_occur_at(attempt, p))
plt.xlabel('trials')
plt.ylabel('probability')
barlist = plt.bar(attempts_to_show, height=[probability_to_occur_at(x, p) for x in attempts_to_show], tick_label=attempts_to_show)
barlist[attempt].set_color('r')
plt.show()
probability that the event will occur on the 8th try: 0.12800000000000003
从条形图中可以看出,尝试的最小值为 1,并且没有最大值。
二项分布 | 泊松分布 | 指数分布 | 均匀分布 | 正态分布 | 卡方分布 | 多元随机变量,分布函数 | 多元随机变量,概率密度 | 多元随机变量,随机变量的依赖和独立系统 | 多元随机变量,数值特征 | 大数定律和切比雪夫不等式 | 中心极限定理 | 经验分布函数 | 直方图 | 统计分布的数值特征 | 推论统计,点估计 | 矩量法 | 最大似然估计 | 假设检验基础 | 假设检验,检验的力量 | 皮尔逊卡方检验 | Kolmogorov-Smirnov 检验 | 均值的置信区间(已知 sigma) | 均值的置信区间(sigma 未知)
应用:Python验证独立性和平稳性时间序列
源代码
Last updated