🧄简单线性回归R和Python预测身高体重国内生产总值二氧化碳排放量
简单线性回归(SLA) | R | Python | 预测 | 国内生产总值(GDP) | 二氧化碳排放量 | 身高体重 | Pandas | Matplotlib | scikit-learn | NumPy
R简单线性回归
简单线性回归
简单线性回归是一种统计技术,用于显示一个因变量和一个自变量之间的关系。 因变量表示为 Y,而自变量表示为 X。变量 X 和 Y 线性相关。
简单线性回归可用于: (a) 描述一个变量对另一个变量的线性相关性; (b) 根据另一个变量的值预测一个变量; (c) 修正一个变量对另一个变量的线性相关性。
简单线性回归模型的形式为:
其中 和 是 的截距和回归系数, 是误差项。
上述中回归系数的解可以使用最小二乘法得出:
要找到残差平方和的最小和(最小二乘线上留下的位),请将下面的总和设置为零:
上述,对 的偏导数:
将上述除以 2,求解 ,得到
现在,
因此,
其中 是 和 的协方差——衡量 如何随 变化的量度。
示例1:预测体重
问题:在一堂统计课上,测量了 30 名学生的体重和身高,如下表所示。
求学生体重与身高的回归。
使用您在 (1) 中的答案来估算身高为 1.80 时,学生的体重值。
解:
根据以上数据,我们得到以下结果:
这些值代入方程中,
回归的斜率为 6.6503。
然后代入方程中的 和 ,得到常数项:
回归模型为体重 = 75.16 6.65*身高
体重 = 75.16 6.65*1.80 = 87.13
R 中的回归计算:
在 R 中指定身高和体重的值,如下所示:
通过回归学生的体重与身高来拟合模型,结果将随之而来。
在上面的结果中,残差统计、系数估计(带有标准误差和相关的 p 值)和所有其他统计(多重 R 平方、调整 R 平方、F 统计等)显示在输出。
示例2:预测国内生产总值
Python简单线性回归
示例3:预测身高
示例4:二氧化碳排放量
Last updated
Was this helpful?