预测过程包括预测时间序列的未来值,或者通过仅基于其过去行为(自回归)对序列进行建模,或者通过使用其他外部变量来进行建模。 本文档描述了如何使用机器学习和统计模型来预测访问网站的流量。
使用自 2020 年 7 月 1 日起,查看网站的每日访问历史。 目标是生成一个能够预测未来 7 天网络流量的预测模型。 用户希望能够在每周一运行模型并获得本周剩余时间的每日流量预测。
data['date'] = pd.to_datetime(data['date'], format='%d/%m/%y')
data = data.set_index('date')
data = data.asfreq('1D')
# Split data: train-validation-test
# ==============================================================================
end_train = '2021-03-30 23:59:00'
end_validation = '2021-06-30 23:59:00'
data_train = data.loc[: end_train, :]
data_val = data.loc[end_train
plot_train = data_train.users.hvplot.line(label='train')
plot_val = data_val.users.hvplot.line(label='val')
plot_test = data_test.users.hvplot.line(label='test')
layout = plot_train * plot_val * plot_test
layout = layout.opts(title='Daily visitors', ylabel='users')
layout