R和Python概率分布统计和Python验证独立性和平稳性时间序列

PreviousR时间序列自回归模型和探索性数据分析 NextR统计回归分布算法示例见解

Last updated 1 year ago

Was this helpful?

R和Python概率分布统计和Python验证独立性和平稳性时间序列

R概率分布和统计

R 基础知识 | 汇总统计数据 | 图形显示 | 概率基础知识 | 概率规则 | 条件概率 | 后验概率和贝叶斯 | 可靠性 | 离散分布介绍

几何分布

概率密度函数

概率密度函数 (pdf) 定义为

$P(X=x)=q^{x-1} p ; \quad x=1,2,3, \ldots$

这是在第 x 次试验中第一次成功的概率。

几何随机变量是离散的，因为它的值是整数，并且是无限的，因为从理论上讲，我们可以永远等待成功。

我们可以很容易地检查 $\sum_{x} P(X=x)=1$

$\begin{aligned}\sum_{x} P(X=x) &=p+q p+q^{2} p+q^{3} p+\cdots \\&=p\left(1+q+q^{2}+q^{3}+\cdots\right)=p \times \frac{1}{1-q}=1\end{aligned}$

记住比率 $q<1$ 的无限几何级数之和是

$1+q+q^{2}+q^{3}+\cdots=\frac{1}{1-q}=\frac{1}{p}$

R代码计算概率密度函数

R 中提供了函数来计算和绘制 pdf。对于几何分布，我们在缩写名称 geom 前加上“d”，用于 pdf；函数 dgeom 连同参数 p，即成功的概率，作为参数来计算概率。

例 3 中的结果，找到了第一个缺陷出现在第五个缺陷中的概率，可以在 R 中检查。

dgeom (x = 4, prob = 0.03)

或

dgeom (4, 0.03)

得出

0.02655878

如果我们绘制 pdf，就会出现更清晰的画面。 R代码

par (mfrow = c(2, 2))
x <- 0:4
plot(x+1, dgeom(x, prob = 0.95),
	xlab = "X = Number of trials", ylab = "P(X=x)",
	type = "h", main = "First workstation, p = 0.95",
	font.main = 1)
x <- 0:9
plot(x+1, dgeom(x, prob = 0.5),
	xlab = "X = Number of trials", ylab = "P(X=x)",
	type = "h", main = "First head, p = 0.5",
	font.main = 1)
x <- 0:19
plot(x+1, dgeom(x, prob = 0.2),
	xlab = "X = Number of trials", ylab = "P(X=x)",
	type = "h", main = "First defective, p = 0.2",
	font.main = 1)
x <- seq(0, 400, 50)
plot(x+1, dgeom(x, prob = 0.01),
	xlab = "X = Number of trials", ylab = "P(X=x)",
	type = "h", main = "First bit in error,
	p = 0.01", font.main = 1)

二项分布 | 超几何分布 | 泊松分布 | 抽样检验方案 | 连续分布 | 指数分布 | 队列 | 正态分布 | 过程控制 | 马尔可夫和切比雪夫不等式

Python概率和统计

基本概念 | 事件操作 | 全概率定律 | 贝叶定理 | 重复实验 | 随机变量，离散随机变量的分布 | 分配功能 | 概率密度函数 | 期望值、众数、中位数 | 矩、方差、标准差

几何分布

import matplotlib.pyplot as plt

def probability_to_occur_at(attempt, probability):
    return (1-p)**(attempt - 1) * probability

p = 0.2
attempt = 3
attempts_to_show = range(21)[1:]
print('probability that the event will occur on the 8th try: ', probability_to_occur_at(attempt, p))
plt.xlabel('trials')
plt.ylabel('probability')
barlist = plt.bar(attempts_to_show, height=[probability_to_occur_at(x, p) for x in attempts_to_show], tick_label=attempts_to_show)
barlist[attempt].set_color('r')
plt.show()

probability that the event will occur on the 8th try: 0.12800000000000003

从条形图中可以看出，尝试的最小值为 1，并且没有最大值。

二项分布 | 泊松分布 | 指数分布 | 均匀分布 | 正态分布 | 卡方分布 | 多元随机变量，分布函数 | 多元随机变量，概率密度 | 多元随机变量，随机变量的依赖和独立系统 | 多元随机变量，数值特征 | 大数定律和切比雪夫不等式 | 中心极限定理 | 经验分布函数 | 直方图 | 统计分布的数值特征 | 推论统计，点估计 | 矩量法 | 最大似然估计 | 假设检验基础 | 假设检验，检验的力量 | 皮尔逊卡方检验 | Kolmogorov-Smirnov 检验 | 均值的置信区间（已知 sigma） | 均值的置信区间（sigma 未知）

应用：Python验证独立性和平稳性时间序列

源代码

PreviousR时间序列自回归模型和探索性数据分析 NextR统计回归分布算法示例见解

Last updated 1 year ago

Was this helpful?

R概率分布和统计

R 基础知识 | 汇总统计数据 | 图形显示 | 概率基础知识 | 概率规则 | 条件概率 | 后验概率和贝叶斯 | 可靠性 | 离散分布介绍

几何分布

概率密度函数

概率密度函数 (pdf) 定义为

$P(X=x)=q^{x-1} p ; \quad x=1,2,3, \ldots$

这是在第 x 次试验中第一次成功的概率。

几何随机变量是离散的，因为它的值是整数，并且是无限的，因为从理论上讲，我们可以永远等待成功。

我们可以很容易地检查 $\sum_{x} P(X=x)=1$

$\begin{aligned}\sum_{x} P(X=x) &=p+q p+q^{2} p+q^{3} p+\cdots \\&=p\left(1+q+q^{2}+q^{3}+\cdots\right)=p \times \frac{1}{1-q}=1\end{aligned}$

记住比率 $q<1$ 的无限几何级数之和是

$1+q+q^{2}+q^{3}+\cdots=\frac{1}{1-q}=\frac{1}{p}$

R代码计算概率密度函数

例 3 中的结果，找到了第一个缺陷出现在第五个缺陷中的概率，可以在 R 中检查。

dgeom (x = 4, prob = 0.03)

或

dgeom (4, 0.03)

得出

0.02655878

如果我们绘制 pdf，就会出现更清晰的画面。 R代码

par (mfrow = c(2, 2))
x <- 0:4
plot(x+1, dgeom(x, prob = 0.95),
	xlab = "X = Number of trials", ylab = "P(X=x)",
	type = "h", main = "First workstation, p = 0.95",
	font.main = 1)
x <- 0:9
plot(x+1, dgeom(x, prob = 0.5),
	xlab = "X = Number of trials", ylab = "P(X=x)",
	type = "h", main = "First head, p = 0.5",
	font.main = 1)
x <- 0:19
plot(x+1, dgeom(x, prob = 0.2),
	xlab = "X = Number of trials", ylab = "P(X=x)",
	type = "h", main = "First defective, p = 0.2",
	font.main = 1)
x <- seq(0, 400, 50)
plot(x+1, dgeom(x, prob = 0.01),
	xlab = "X = Number of trials", ylab = "P(X=x)",
	type = "h", main = "First bit in error,
	p = 0.01", font.main = 1)

二项分布 | 超几何分布 | 泊松分布 | 抽样检验方案 | 连续分布 | 指数分布 | 队列 | 正态分布 | 过程控制 | 马尔可夫和切比雪夫不等式

Python概率和统计

基本概念 | 事件操作 | 全概率定律 | 贝叶定理 | 重复实验 | 随机变量，离散随机变量的分布 | 分配功能 | 概率密度函数 | 期望值、众数、中位数 | 矩、方差、标准差

几何分布

import matplotlib.pyplot as plt

def probability_to_occur_at(attempt, probability):
    return (1-p)**(attempt - 1) * probability

p = 0.2
attempt = 3
attempts_to_show = range(21)[1:]
print('probability that the event will occur on the 8th try: ', probability_to_occur_at(attempt, p))
plt.xlabel('trials')
plt.ylabel('probability')
barlist = plt.bar(attempts_to_show, height=[probability_to_occur_at(x, p) for x in attempts_to_show], tick_label=attempts_to_show)
barlist[attempt].set_color('r')
plt.show()

probability that the event will occur on the 8th try: 0.12800000000000003

从条形图中可以看出，尝试的最小值为 1，并且没有最大值。

二项分布 | 泊松分布 | 指数分布 | 均匀分布 | 正态分布 | 卡方分布 | 多元随机变量，分布函数 | 多元随机变量，概率密度 | 多元随机变量，随机变量的依赖和独立系统 | 多元随机变量，数值特征 | 大数定律和切比雪夫不等式 | 中心极限定理 | 经验分布函数 | 直方图 | 统计分布的数值特征 | 推论统计，点估计 | 矩量法 | 最大似然估计 | 假设检验基础 | 假设检验，检验的力量 | 皮尔逊卡方检验 | Kolmogorov-Smirnov 检验 | 均值的置信区间（已知 sigma） | 均值的置信区间（sigma 未知）