终于把时间序列分析的关键点全讲清楚了!
时间序列的定义
随机变量 的取值是连续的。 时间索引集合 是离散且等距的。
随机变量(Random variables)用大写字母表示,即 ,同时随机变量的值是从一个分布中采样给出。而且可以为无限多个时间点 定义随机变量。 观测(Observations)用小写字母表示,即 ,观测可以认为是随机变量的实现。但通常在实际中,我们的观测点是有限的,因此定义 个观测是 。
时间序列分析的目标
描述:描述时间序列的主要特征,例如:序列是递增还是递减;是否有季节性模式(例如,夏季较高,冬季较低);第二个解释变量如何影响时间序列的值? 监控:检测时间序列行为何时发生变化,例如销售额突然下降,或者突然出现峰值。 预测:从当前值预测时间序列的未来值,并量化这些预测中的不确定性,比如根据今天的气温预测未来几天的温度。 回归:给定多个时间序列以及与这些序列对应的一个额外的值,找到其中的关系。 分类:给定多个时间序列,将它们按照相似性进行分类。 ......
时间序列的建模
趋势(Trend)- 趋势体现的是时间序列数据均值随时间的长期变化。如果趋势存在,它的形状通常会引起人们的兴趣,尽管它可能不是线性的。 季节性影响(Seasonal effect)- 季节性影响是时间序列中以固定间隔重复的趋势。严格来说,季节性效应只是每年都会重复的效应,但在更一般的情况下,可以更广泛地使用该术语来表示任何定期重复的模式。 无法解释的变化(Unexplained variation)- 无法解释的变化是在任何趋势和季节性变化被去除后时间序列中其余的变化。这种无法解释的变化可能是独立的,也可能表现出短期相关性。
加法模型(Additive):
乘法模型(Multiplicative):
Example of additive model
时间序列的特性
均值(Mean function)
方差(Variance function)
自协方差和自相关函数(Autocovariance and autocorrelation functions)
lag=0
lag=1
lag=
Correlogram图的解释
Example - purely random data
当 时, ,因为它是序列与其自身的相关性,通常忽略该值。 对于没有相关性的纯随机序列,通常在滞后 0 处等于 1,但在其他滞后处没有明显的相关性证据。
Example - short-term correlation
Example - alternating data
Example - data with a seasonal effect
Example - data with a trend and a seasonal effect
平稳性分析
strictly stationary or strongly stationary
weakly stationary
均值是常数和有限的,即 方差是常数和有限的,即 自协方差和自相关函数仅取决于滞后 ,即 以及
Example
作者:daydaymoyu
来源:https://zhuanlan.zhihu.com/p/424609116
参考:https://bookdown.org/gary_a_napier/time_series_lecture_notes/ChapterOne.html#time-series-modelling
评论