• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

读懂时序预测模型1

武飞扬头像
数据分析-中志
帮助1

我们都渴望预测未来,而时序预测作为一种预测未来的方法或模型被人们广泛的认知,时序序列的预测方法却不被相关的数据分析人员广泛的了解,下面就逐步和大家一起探讨时序序列模型。、

模型的使用

首先和大家一起探讨一下模型的使用,现在介绍时序预测模型之前啰嗦几句,其中在模型的使用方面有一句特别著名的话,就是:

All models are wrong, but some are useful.
所有模型都是错的,但有些是有用的。

这句话,其实看似矛盾和平常,但却深深的融入在我们的工作和学习当中。其实,从某种意义上讲,我们每个人也都是一个模型,都在不断优化着自己的参数和结构。当然,我们在模型的使用的过程当中,也许牢牢记住这句话。

这句话里的模型应该是针对现实世界的模型,针对“理想状况”的模型完全可以是对的。

对于前半句【all models are wrong】的理解:影响现实因素如此之多。由于人类的认知能力的局限性(对于模型中各变量的作用关系认知局限)或有些数据难以获取以及数据的测量难度、测量错误等(缺失变量或不准确的变量),模型的构建无法达到“上帝视角”的程度。所以,现实的世界无法完全按照我们的模型发展,现实和模型的差距,模型当然就是错的。无论是数学模型还是物理模型都是对于现实世界的一种尝试性的一种解释。

对于后半句【but some are useful】的理解:虽然模型与现实世界存在一定的差距,但是模型可以告诉我们现实中的一些规律性的东西。比如说:很多人都在炒基金,一般的规律是基金短期内可能是赔钱的,但是大多数基金长期是盈利的。也就是说,模型在一定的条件下,同时在一定的误差可以接受的情况下模型是可以用的。

时间序列

下面开始进入正题,开始介绍时序序列模型。这里首先介绍一下时间序列,时间序列是将某种统计指标的数值,按照时间先后顺序所形成的数列。例如去年一年每天的上证综合指数的收盘价格、过去一年济南市每天的交通运行指数变化等。时间序列预测就是通过分析时间序列反映出来的发展过程、方向和趋势,进行类推或延伸,预测下一段时间可能达到的水平。时间序列异常检测就是通过历史的数据分析,查看当前的数据是否发生了明显的异常。下面以上证指数为例子做一下简单的介绍。

学新通
其中,图中一段时间上证指数每天价格的变化,便是时间序列。那么我们采用这张图的综合指数的变化值,去预测明天的值的变化,便是时间序列预测。同时我们发现某一天上证指数跌幅超过了30%,那么我们可以根据经验发现你这个为异常值。那么判断,便是时间序列异常检测。

基本时间序列预测方法介绍

上面啰嗦了很多,这里对时间预测方法进行介绍,本节当中,会介绍简单平移法、简单平均法、移动平均法、简答指数平滑法、霍尔特(holt)线性趋势法。

数据介绍

本文所采用的数据是汉口测量的从1865年1月至1978年12月长江每月的流量,共计1368个数据点。数据如下所示(由于位置太小,月份没有显示):

学新通
流量数据案例:
学新通

简单平移法

如果时序数据集在一段时间内都很稳定,我们预测未来最近一个时刻的数据点,可以取前一时刻,直接变为预测的值。这种假设数据在一段时间内不会发生变化,即假设待预测点与上一个观察点相等,这种方法被称为简单平移法。公式如下所示:
学新通
其中下图类似的数据可以采用简单平移法:
学新通

上图中,纵轴为某一商品的价格,横轴为时间。从图中可以看出,上述的数据变化平缓,采用简单平移法也可以取得比较好的而结果。

因本次采用的流量数据变化幅度较大,并不适用采用简单平移法,所以在数据演示的过程中,就不演示此方法的预测过程了。

简单平均法

我们在做时序数据预测的过程中,经常会遇到这样一些数据集, 虽然相关数据在一定时期会小幅波动,但是一定时段的数据的平均值确实保持不变。在这种情况下,可以采用简单平均的方法。 简单平均法主要将历史所有的观测点的数值进行加和平均,所以这种方法叫做简单平均法。简单平均法的公式如下所示:

学新通
采用历史数据,预测下一个月的流量情况。采用简单平均法预测的流量结果如有下所示:
学新通
从上述结果中可以发现,流量具有较大幅度的波动,简单平均法整体预测效果并不好。

移动平均法

我们之前遇到过这样的数据,虽然数值整体的变化比较大,但是最近一段时间确波动较小,也就是说,预测可以采用近期一段时间的平均数值,来作为预测结果。整体数据的形式如下图所示。

学新通
上图为模拟的价格随着时间变化的图,物品价格在一段时间内大幅上涨,但后来又趋于平稳。我们也经常会遇到这种数据集,比如价格或销售额某段时间大幅上升或下降。如果我们这时用之前的简单平均法,就得使用所有先前数据的平均值,但所有数据明显会造成数据很大的误差,因为用开始阶段的价格值会大幅影响接下来日期的预测值。因此,我们只取最近几个时期的价格平均值。很明显这里的逻辑是只有最近的值最要紧。这种最近一段时间的历史数值计算平均值的预测方法就叫移动平均法。
移动平均法的计算公式如下所示:
学新通
这里的p即为移动平均的窗口。

下面采用移动平均法预测未来一个月长江的流量,其中测试集为1978年长江的流量。本次测试的滑动窗口采用的是3。【不过在这里也说明,由于数据集的波动和周期性,采用的数据并适合移动平均法】。

学新通

加权移动平滑法

通过移动平均法的结果及对数据的分析我们可以发现,最近一次的数据可能对结果有较大的影响,那么我们可不可以给予最近的数值赋予更大的权重呢。下面给大家介绍一下加权移动平均法,加权移动平均法即对“滑动窗口期”内的值赋予不同的权重,通常来讲,最近时间点的值发挥的作用更大。
学新通
下面我们仍然采用长江流量的数据,采用移动加权平均法预测未来一个月长江的流量,其中测试集为1978年长江的流量。本次测试的滑动窗口采用的是3,权重为0.8,0.2,0.1【不过在这里也说明,由于数据集的波动和周期性,采用的数据并适合移动平均法】。
学新通
通过结果我们可以看到,整体输出的结果较移动平均结果有所改善。

指数平滑法

通过分析上面介绍的简单平均法和加权移动平均法,我们可以发现二者在时间点选取的思路上有一定的差距。同时可以认为采用加权移动平均法,没有对滑窗之前的数据加以使用,造成了数据损失,那么我们可不可以将所有的数据都进行考虑,给与所有数据以不同的权重。如,相比更早时期内的观测值,它会给近期的观测值赋予更大的权重。按照这种原则工作的方法就叫做简单指数平滑法。它通过加权平均值计算出预测值,其中权重随着观测值从早期到晚期的变化呈指数级下降,最小的权重和最早的观测值相关,指数平滑法分为一级指数平滑法、二级指数平滑等,这里介绍一下1级指数平滑:
学新通
指数平滑法的结果如下所示,其中参数设置为0.8。
学新通

霍尔特(Holt)线性趋势法

上面介绍了相关的时序预测方法,这里进一步介绍一下霍尔特(holt)趋势法。霍尔特趋势法一般应用于下面类似的数据。

学新通

如上图所示,物品的价格在不断的上涨,但是我们上述的方法中,我们并没有考虑这种趋势,即我们在一段时间内观察到的整体的价格趋势性变化。对于这种趋势性的变化,我们可以采用霍尔特线性趋势法进行预测。

每个时序数据集可以分解为相应的几个部分:趋势(Trend),季节性(Seasonal)和残差(Residual)。任何呈现某种趋势的数据集都可以用霍尔特线性趋势法用于预测。

sm.tsa.seasonal_decompose(flow_data['flows']).plot()
result = sm.tsa.stattools.adfuller(flow_data['flows'])
plt.show()

学新通

我们从图中可以看出,该数据集没有明显的上升趋势,不适合简单使用霍尔特线性趋势预测方法。但是通过图中我们可以发现,该数据集有明显的周期性。为了对霍尔特线性趋势预测方法进行演示,本次还是选择上述流量数据进行模型搭建。

霍尔特趋势线性预测法包含三个方程,分别为,一个水平方程,一个趋势方程,一个方程将二者相加得到预测值。其公式如下:
学新通
上面算法中预测的值称为水平(level)。正如简单指数平滑一样,这里的水平方程显示它是观测值和样本内单步预测值的加权平均数,趋势方程显示它是根据 ℓ(t)−ℓ(t−1) 和之前的预测趋势 b(t−1) 在时间t处的预测趋势的加权平均值。

我们将这两个方程相加,得出一个预测函数。我们也可以将两者相乘而不是相加得到一个乘法预测方程。当趋势呈线性增加和下降时,我们用相加得到的方程;当趋势呈指数级增加或下降时,我们用相乘得到的方程。实践操作显示,用相乘得到的方程,预测结果会更稳定,但用相加得到的方程,更容易理解。
学新通

总结

上面介绍了基本的时序预测方法,同时也介绍了相关时序预测方法的使用场景(这里提醒大家,在进行时序预测模型选择的时候,一定要结合场景使用,没有最好的模型,只有模型使用的恰当其时才会发挥作用),下一篇文章将给大姐介绍高阶时序预测模型。

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhgebabc
系列文章
更多 icon
同类精品
更多 icon
继续加载