数学建模学习笔记(十)——时间序列模型

article/2025/10/5 19:21:07

文章目录

    • 一、时间序列综述
    • 二、时间序列数据以及基本概念
    • 三、时间序列分解
    • 四、指数平滑模型
    • 五、一元时间序列分析的模型
    • 六、AR(p)模型
    • 七、MA(q)模型
    • 八、ARMA(p, q)模型
    • 九、模型选择:AIC 和 BIC 准则(选小准则)
    • 十、检验模型是否识别完全
    • 十一、ARIMA(p, d, q)模型
    • 十二、SARIMA模型
    • 十三、时间序列建模思路

一、时间序列综述

时间序列是指某种现象的指标按照时间顺序排列而成的数值序列。

本文主要介绍时间序列分析中常用的三种模型:季节分解、指数平滑方法以及 ARIMA 模型。

二、时间序列数据以及基本概念

  1. 时间序列的数据
    时间序列的数据类型主要是对同一对象在不同时间连续观察所得到的数据。例如:某个地方 24 小时内每隔一个小时的温度数据;二胎政策以来每年的人口数量……
  2. 时间序列的基本概念
    时间序列主要有两个组成要素构成:
    1. 时间要素
      年、季度、月份、周……
    2. 数值要素
      时间要素对应的数值数据……
  3. 时间序列根据时间和数值性质的不同,可以分为时期时间序列和时点时间序列。
    1. 时期时间序列
      顾名思义,时期时间序列的数据要素反应的就是在一定时期内的发展水平……(例如:上文所提到的温度数据就是在每隔一小时后的时间点上测得的数据)
    2. 时点时间序列
      同样,时点时间序列的数据要素反应的就是在一定时点上的瞬间水平……(例如:上文所提到的人口数据就是由一年这一时期中人口变化二测得的数据)

三、时间序列分解

时间序列的数值变化规律一般有以下四种:长期变动趋势、季节变动规律、周期变动规律、不规则变动。一个时间序列往往是以上四类变化形式的叠加。

数值变化规律字母表示意义
长期趋势T统计指标在相当长的一段时间内,收到长期趋势影响因素的影响,表现出的持续上升或者持续下降的趋势
季节趋势S由于季节的转变使得指标数值发生周期性变动(其周期一般以月、季、周为单位,不能以年为单位)
循环变动C循环变动的周期往往是若干年,其在曲线图上表现为波浪式的周期变动
不规则变动I由某些随机因素导致的数值变化,并且这些因素的作用不可预知且没有规律性

这四种变动与指标数值的关系可能是叠加关系,也可能是乘积关系。

  1. 叠加模型和成绩模型

    1. 如果四种变动之间是相互独立的关系,那么可以使用叠加模型: Y = T + S + C + I Y = T + S + C + I Y=T+S+C+I
    2. 如果四种变动之间存在相互影响关系,那么可以使用乘积模型: Y = T × S × C × I Y = T \times S \times C \times I Y=T×S×C×I

    注意:
    (1)使用时间序列分解的前提是具有年内的周期性(不包括以年份为周期的数据)
    (2)在具体的时间序列图中,如果随着时间的推移,序列的季节波动越来越大,此时应该采用乘积模型;反之,如果时间序列图的波动保持恒定,则应该采用叠加模型

  2. 下面来看一个例子
    进行时间序列分解的步骤主要有以下几步:
    处理缺失值 ⇒ \Rightarrow 定义时间变量 ⇒ \Rightarrow 做出时序图选择模型 ⇒ \Rightarrow 进行时间序列分解

    在这个例子中,我们可以做出的时序图如下:在这里插入图片描述
    可以看出,第二季度的销量明显高于其他季度,因此数据表现出很强的季节性。同时,销量数据的季节波动变化不大,因此可以使用加法分解模型。

    在 SPSS 中对数据进行季节性分解可得到结果为:在这里插入图片描述
    从表格中可知:第一二季度的季节因子为正,第三四季度的季节因子为负,说明第一二季度的平均销量要高于第三四季度。并且第二季度的平均销量要高于全年平均水平 20.930 件;第四季度的平均销量要低于全年平均水平 19.727 件。

    有意思的是:采用加法模型时,季节因子的和为 0 ;而采用乘法模型时,季节因子的乘积为 1 ,同时,乘法模型的季节因子表示是全年平均销量的倍数。

四、指数平滑模型

  1. 简单(Simple)模型

    名称使用条件与之类似的ARIMA模型
    简单指数平滑法不含趋势和季节成分ARIMA(0, 1, 1)

    x t x_t xt t t t 时刻的观测数据, S t S_t St 为第 t t t 期的平滑值,且令 S t = x ^ t + 1 S_t = \hat{x}_{t + 1} St=x^t+1,即第 t + 1 t + 1 t+1 期的预测值,且满足: x ^ t + 1 = α x t + ( 1 − α ) x t ^ \hat{x}_{t + 1} = \alpha x_t + (1 - \alpha)\hat{x_t} x^t+1=αxt+(1α)xt^,因此可以证明: x ^ t + 1 = α x t + α ( 1 − α ) x t − 1 + α ( 1 − α ) 2 x t − 2 + ⋯ + α ( 1 − α ) t − 1 x 1 + ( 1 − α ) t l 0 \hat{x}_{t + 1} = \alpha x_t + \alpha(1 - \alpha)x_{t - 1} + \alpha(1 - \alpha)^2x_{t - 2} + \cdots + \alpha(1 - \alpha)^{t - 1}x_1 + (1 - \alpha)^tl_0 x^t+1=αxt+α(1α)xt1+α(1α)2xt2++α(1α)t1x1+(1α)tl0,其中 l 0 = x ^ 1 l_0 = \hat{x}_1 l0=x^1 视为初始值, α \alpha α 为平滑系数 ( 0 ≤ α ≤ 1 ) (0 \leq \alpha \leq 1) (0α1)

    还可以看出,越接近当期的数据,其权重越大,意味着影响也越大;反之,早期数据对当期影响也就越小。

    平滑指数 α \alpha α 一般是需要我们自己决定的。但是,SPSS 的专家建模器如果采用简单模型帮助我们建模会自动给出 α \alpha α 的值。

    简单(Simple)模型只能往后预测一期数据,原因是公式 x ^ t + 1 = α x t + ( 1 − α ) x t ^ \hat{x}_{t + 1} = \alpha x_t + (1 - \alpha)\hat{x_t} x^t+1=αxt+(1α)xt^ 中使用了本期的准确数据 x t x_t xt ,后面的数据只是预测出来的,而不是准确的。

  2. 线性趋势模型( l i n e a r t r e n d linear\ \ trend linear  trend

    名称使用条件与之类似的 ARIMA 模型
    特线性趋势模型线性趋势、不含季节成分ARIMA(0, 2, 2)

    该方法包含一个预测方程和两个平滑方程: { l t = α x t + ( 1 − α ) ( l t − 1 + b t − 1 ) (水平平滑方程) b t = β ( l t − l t − 1 ) + ( 1 − β ) b t − 1 (趋势平滑方程) x ^ t + h = l t + h b t , h = 1 , 2 , ⋯ (预测方程) \left\{ \begin{aligned} &l_t = \alpha x_t + (1 - \alpha)(l_{t - 1} + b_{t - 1}) \text{(水平平滑方程)} \\ &b_t = \beta(l_t - l_{t - 1}) + (1 - \beta)b_{t - 1} \text{(趋势平滑方程)} \\ &\hat{x}_{t + h} = l_t + hb_t, h = 1, 2, \cdots \text{(预测方程)} \end{aligned} \right. lt=αxt+(1α)(lt1+bt1)(水平平滑方程)bt=β(ltlt1)+(1β)bt1(趋势平滑方程)x^t+h=lt+hbt,h=1,2,(预测方程)
    t t t:当前期
    h h h:预测超前期数,也称之为预测补偿
    x t x_t xt:第 t t t 期的实际观测值
    l t l_t lt:时刻 t t t 的预估水平
    b t b_t bt:时刻 t t t 的预测趋势
    α \alpha α:水平的平滑参数
    β \beta β:趋势的平滑参数

  3. 阻尼趋势模型( D a m p e d t r e n d Damped\ \ trend Damped  trend

    使用条件与之类似的 ARIMA 模型
    尼趋势模型线性趋势逐渐减弱且不含季节成分ARIMA(1, 1, 2)

    { l t = α x t + ( 1 − α ) ( l t − 1 + ϕ b t − 1 ) (水平平滑方程) b t = β ( l t − l t − 1 ) + ( 1 − β ) ϕ b t − 1 (趋势平滑方程) x ^ t + h = l t + ( ϕ + ϕ 2 + ⋯ + ϕ h ) b t (预测方程) \left\{ \begin{aligned} &l_t = \alpha x_t + (1 - \alpha)(l_{t - 1} + \phi b_{t - 1}) \text{(水平平滑方程)} \\ &b_t = \beta(l_t - l_{t - 1}) + (1 - \beta)\phi b_{t - 1} \text{(趋势平滑方程)} \\ &\hat{x}_{t + h} = l_t + (\phi + \phi^2 + \cdots + \phi^h)b_t \text{(预测方程)} \end{aligned} \right. lt=αxt+(1α)(lt1+ϕbt1)(水平平滑方程)bt=β(ltlt1)+(1β)ϕbt1(趋势平滑方程)x^t+h=lt+(ϕ+ϕ2++ϕh)bt(预测方程) α \alpha α:水平的平滑参数
    β \beta β:趋势的平滑参数
    ϕ \phi ϕ:阻尼参数( 0 < ϕ ≤ 1 0 < \phi \leq 1 0<ϕ1
    如果 ϕ = 1 \phi = 1 ϕ=1,则阻尼趋势模型就是霍特线性趋势模型。

  4. 简单季节性

    简单季节性使用条件与之类似的 ARIMA 模型
    单季节性含有稳定的季节成分、不含趋势SARIMA(0, 1, 1) × (0, 1, 1) s _s s

    { l t = α ( x t − s t − m ) + ( 1 − α ) l t − 1 (水平平滑方程) s t = γ ( x t − l t − 1 ) + ( 1 − γ ) s t − m (季节平滑方程) x ^ t + h = l t + s t + h − m ( k + 1 ) , k = [ h − 1 m ] (预测方程) \left\{ \begin{aligned} &l_t = \alpha(x_t - s_{t - m}) + (1 - \alpha)l_{t - 1} \text{(水平平滑方程)} \\ &s_t = \gamma(x_t - l_{t - 1}) + (1 - \gamma)s_{t - m} \text{(季节平滑方程)} \\ &\hat{x}_{t + h} = l_t + s_{t + h - m(k + 1)}, k = [\frac{h - 1}{m}] \text{(预测方程)} \end{aligned} \right. lt=α(xtstm)+(1α)lt1(水平平滑方程)st=γ(xtlt1)+(1γ)stm(季节平滑方程)x^t+h=lt+st+hm(k+1),k=[mh1](预测方程) m m m:周期长度(月度数据取12,季度数据取4)
    α \alpha α:水平的平滑参数
    γ \gamma γ:季节的平滑参数
    h h h:预测超前期数
    x ^ t + h \hat{x}_{t + h} x^t+h:第 h h h 期的预测值

  5. 温特加法模型( W i n t e r ′ s a d d i t i v e Winter's\ \ additive Winters  additive

    使用条件与之类似的 ARIMA 模型
    特加法模型含有线性趋势和稳定的季节成分SARIMA(0, 1, 0) × (0, 1, 1) s _s s

    { l t = α ( x t − s t − m ) + ( 1 − α ) ( l t − 1 + b t − 1 ) (水平平滑方程) b t = β ( l t − l t − 1 ) + ( 1 − β ) b t − 1 s t = γ ( x t − l t − 1 − b t − 1 ) + ( 1 − γ ) s t − m (季节平滑方程) x ^ t + h = l t + h b t + s t + h − m ( k + 1 ) , k = [ h − 1 m ] (预测方程) \left\{ \begin{aligned} &l_t = \alpha(x_t - s_{t - m}) + (1 - \alpha)(l_{t - 1} + b_{t - 1}) \text{(水平平滑方程)} \\ &b_t = \beta(l_t - l_{t - 1}) + (1 - \beta)b_{t - 1} \\ &s_t = \gamma(x_t - l_{t - 1} - b_{t - 1}) + (1 - \gamma)s_{t - m} \text{(季节平滑方程)} \\ &\hat{x}_{t + h} = l_t + hb_t + s_{t + h - m(k + 1)}, k = [\frac{h - 1}{m}] \text{(预测方程)} \end{aligned} \right. lt=α(xtstm)+(1α)(lt1+bt1)(水平平滑方程)bt=β(ltlt1)+(1β)bt1st=γ(xtlt1bt1)+(1γ)stm(季节平滑方程)x^t+h=lt+hbt+st+hm(k+1),k=[mh1](预测方程) m m m:周期长度(月度数据取12,季度数据取4)
    α \alpha α:水平的平滑参数
    β \beta β:趋势的平滑参数
    γ \gamma γ:季节的平滑参数
    x ^ t + h \hat{x}_{t + h} x^t+h:第 h h h 期的预测值

  6. 温特乘法模型( W i n t e r ′ s m u l t i p l i c a t i v e Winter's\ \ multiplicative Winters  multiplicative

    使用条件与之类似的 ARIMA 模型
    特乘法模型含有线性趋势和不稳定的集结成分不存在

    { l t = α x t s t − m + ( 1 − α ) ( l t − 1 + b t 1 ) (水平平滑方程) b t = β ( l t − l t − 1 ) + ( 1 − β ) b t − 1 (趋势平滑方程) s t = γ x t l t − 1 + b t + 1 + ( 1 − γ ) s t − m (季节平滑方程) x ^ t + h = ( l t + h b t ) s t + h − m ( k + 1 ) , k = [ h − 1 m ] (预测方程) \left\{ \begin{aligned} &l_t = \alpha \frac{x_t}{s_{t - m}} + (1 - \alpha)(l_{t - 1} + b{t_1}) \text{(水平平滑方程)} \\ &b_t = \beta(l_t - l_{t - 1}) + (1 - \beta)b_{t - 1} \text{(趋势平滑方程)} \\ &s_t = \gamma \frac{x_t}{l_{t - 1} + b_{t + 1}} + (1 - \gamma)s_{t - m} \text{(季节平滑方程)} \\ &\hat{x}_{t + h} = (l_t + hb_t)s_{t + h - m(k + 1)}, k = [\frac{h - 1}{m}] \text{(预测方程)} \end{aligned} \right. lt=αstmxt+(1α)(lt1+bt1)(水平平滑方程)bt=β(ltlt1)+(1β)bt1(趋势平滑方程)st=γlt1+bt+1xt+(1γ)stm(季节平滑方程)x^t+h=(lt+hbt)st+hm(k+1),k=[mh1](预测方程) m m m:周期长度(月度数据取12,季度数据取4)
    α \alpha α:水平的平滑参数
    β \beta β:趋势的平滑参数
    γ \gamma γ:季节的平滑参数
    x ^ t + h \hat{x}_{t + h} x^t+h:第 h h h 期的预测值

五、一元时间序列分析的模型

  1. 平稳时间序列( s t a t i o n a r y s e r i e s stationary\ \ series stationary  series
    若时间序列 { x t } \{x_t\} {xt} 满足下列三个条件:
    (1) E ( x t ) = E ( x t − s ) = u E(x_t) = E(x_{t - s}) = u E(xt)=E(xts)=u(均值为固定常数)
    (2) V a r ( x t ) = V a r ( x t − s ) = σ 2 Var(x_t) = Var(x_{t - s}) = \sigma^2 Var(xt)=Var(xts)=σ2(方差存在且为常数)
    (3) C o v ( x t , x t − s ) = γ s Cov(x_t, x_{t-s}) = \gamma_s Cov(xt,xts)=γs(协方差只和间隔 s s s 有关,与 t t t 无关)
    则称 { x t } \{x_t\} {xt} 为协方差平稳,又称为弱平稳。

    如果对于任意的 t 1 , t 2 , ⋯ , t k t_1, t_2, \cdots, t_k t1,t2,,tk h h h,多维随机变量 ( x t 1 , x t 2 , ⋯ , x t k ) (x_{t_1}, x_{t_2}, \cdots, x_{t_k}) (xt1,xt2,,xtk) ( x t 1 + h , x t 2 + h , ⋯ , x t k + h ) (x_{t_1 + h}, x_{t_2 + h}, \cdots, x_{t_k} + h) (xt1+h,xt2+h,,xtk+h) 的联合分布相同,则称 { x t } \{x_t\} {xt} 为严格平稳。

    注:严格平稳的要求太高,因此一般所说的平稳都是弱平稳。

  2. 白噪声序列
    若时间序列 { x t } \{x_t\} {xt} 满足下列三个条件:
    (1) E ( x t ) = E ( x t − s ) = 0 E(x_t) = E(x_{t - s}) = 0 E(xt)=E(xts)=0(均值为固定常数)
    (2) V a r ( x t ) = V a r ( x t − s ) = σ 2 Var(x_t) = Var(x_{t - s}) = \sigma^2 Var(xt)=Var(xts)=σ2(方差存在且为常数)
    (3) C o v ( x t , x t − s ) = 0 ( s ≠ 0 ) Cov(x_t, x_{t-s}) = 0(s \neq 0) Cov(xt,xts)=0(s=0)(协方差只和间隔 s s s 有关,与 t t t 无关)
    则称 { x t } \{x_t\} {xt} 为白噪声序列。显然,白噪声序列是平稳时间序列的一个特例。

  3. 差分方程
    将凑个时间序列变量表示为该变量的滞后项、时间和其他变量的函数,这样一个函数方程称为差分方程。例如:
    y t = α 0 + α 1 y t − 1 + α 2 y t − 2 + ⋯ + α p y t − p + ε t y_t = \alpha_0 + \alpha_1y_{t - 1} + \alpha_2y_{t - 2} + \cdots + \alpha_py_{t - p} + \varepsilon_t yt=α0+α1yt1+α2yt2++αpytp+εt ε \varepsilon ε为白噪声序列)

    1. 差分方程的齐次部分
      只包含该变量自身和它的滞后项的式子。
      例如: y t = α 0 + ∑ i = 1 p α i y t − i + ε t + ∑ i = 1 q β ε t − i y_t = \alpha_0 + \sum_{i = 1}^{p}\alpha_iy_{t - i} + \varepsilon_t + \sum_{i = 1}^{q}\beta \varepsilon_{t - i} yt=α0+i=1pαiyti+εt+i=1qβεti 齐次部分为: y t = ∑ i = 1 p α y t − i y_t = \sum_{i = 1}^{p}\alpha y_{t - i} yt=i=1pαyti
    2. 差分方程的特征方程
      齐次部分可以被转换为特征方程:令 y t = x t y_t = x^t yt=xt 带入齐次方程花间即可。例如:齐次部分: y t = ∑ i = 1 p α y t − i y_t = \sum_{i = 1}^{p}\alpha y_{t - i} yt=i=1pαyti 那么特征方程为: x p = α 1 x p − 1 + α 2 + ⋯ + α p x^p = \alpha_1x^{p - 1} + \alpha_2 + \cdots + \alpha_p xp=α1xp1+α2++αp 特征方程是一个 p p p 阶多项式,对应可以求出 p p p 个解。
  4. 滞后算子
    用符号 L L L 表示滞后算子: L i y t = y t − i L^iy_t = y_{t - i} Liyt=yti,且由如下的性质:
    (1) L C = C LC = C LC=C C C C 为常数)
    (2) ( L i + L j ) y t = y t − i + y t − j (L^i + L^j)y_t = y_{t - i} + y_{t - j} (Li+Lj)yt=yti+ytj
    (3) L i L j y t = y t − i − j L^iL^jy_t = y_{t - i - j} LiLjyt=ytij
    例如: y i = α 0 + ∑ i = 1 p α i y t − i + ε t + ∑ i = 1 q β i ε t − i y_i = \alpha_0 + \sum_{i = 1}^{p}\alpha_iy_{t - i} + \varepsilon_t + \sum_{i = 1}^{q}\beta_i\varepsilon_{t - i} yi=α0+i=1pαiyti+εt+i=1qβiεti 可以表示为: y t = α 0 + ∑ i = 1 p α i L i y t + ε t + ∑ i = 1 q β i L i ε t y_t = \alpha_0 + \sum_{i = 1}^{p}\alpha_iL^iy_t + \varepsilon_t + \sum_{i = 1}^{q}\beta_iL^i\varepsilon_t yt=α0+i=1pαiLiyt+εt+i=1qβiLiεt

六、AR(p)模型

p p p 阶的自回归模型(AR§模型):
y t = α 0 + α 1 y t − 1 + α 2 y t − 2 + ⋯ + α p y t − p + ε t y_t = \alpha_0 + \alpha_1y_{t - 1} + \alpha_2y_{t - 2} + \cdots + \alpha_py_{t - p} + \varepsilon_t yt=α0+α1yt1+α2yt2++αpytp+εt ε \varepsilon ε 是方差为 σ 2 \sigma^2 σ2 的白噪声序列
(自回归:将自己的 1 至 p p p 阶滞后项视为自变量来进行回归)

  1. 注意
    讨论的AR§模型一定是平稳的时间序列模型,原数据不平稳的话也要先转换为平稳的数据才能进行建模。

  2. AR§模型平稳的条件
    将 AR§ 模型的齐次部分转换为特征方程: x p = α 1 x p − 1 + α 2 x p − 2 + ⋯ + α p x^p = \alpha_1x_{p - 1} + \alpha_2x_{p - 2} + \cdots + \alpha_p xp=α1xp1+α2xp2++αp 特征方程是一个 p p p 阶多项式,因此可以求出 p p p 个解(可能有实根,也可能有虚根)

    那么模型的平稳可以这样确定:
    (1)如果这 p p p 个解的模长均小于1,则 { y t } \{y_t\} {yt} 平稳,即 AR§ 模型平稳;
    (2)如果这 p p p 个解中有 k k k 个解的模场等于1,则 { y t } \{y_t\} {yt} k k k 阶单位根过程( k k k 阶单位根过程可以经过 k k k 阶差分变为平稳的时间序列)
    (3)如果这 p p p 个根至少有一个的模长大于1,则 { y t } \{y_t\} {yt} 称为爆炸过程。

  3. 下面来看一个例子
    AR(3) 模型: y t = 0.1 + 0.2 y t − 1 + 0.3 y t − 2 + 0.5 y t − 3 + ε t y_t = 0.1 + 0.2y_{t - 1} + 0.3y_{t - 2} + 0.5y_{t - 3} + \varepsilon_t yt=0.1+0.2yt1+0.3yt2+0.5yt3+εt 齐次部分的特征方程为: x 3 = 0.2 x 2 + 0.3 x + 0.5 x^3 = 0.2x^2 + 0.3x + 0.5 x3=0.2x2+0.3x+0.5 解得: x 1 = − 4 − 34 i 10 , x 2 = − 4 + 34 i 10 , x 3 = 1 x_1 = \frac{-4 - \sqrt{34}i}{10}, x_2 = \frac{-4 + \sqrt{34}i}{10}, x_3 = 1 x1=10434 i,x2=104+34 i,x3=1
    求模长: ∣ x 1 ∣ = ∣ x 2 ∣ = 16 100 + 34 100 = 0.7071 < 1 |x_1| = |x_2| = \sqrt{\frac{16}{100} + \frac{34}{100}} = 0.7071 < 1 x1=x2=10016+10034 =0.7071<1

    所以 y t y_t yt 为一阶单位根过程

    此时可以进行一阶差分变形: y t − y t − 1 = 0.1 − 0.8 ( y t − 1 − y t − 2 ) − 0.5 ( y t − 2 − y t − 3 ) + ε t y_t - y_{t - 1} = 0.1 - 0.8(y_{t - 1} - y_{t - 2}) - 0.5(y_{t - 2} - y_{t - 3}) + \varepsilon_t ytyt1=0.10.8(yt1yt2)0.5(yt2yt3)+εt ⇒ Δ y t = 0.1 − 0.8 Δ y t − 1 − 0.5 Δ y t − 2 + ε t \Rightarrow \Delta y_t = 0.1 - 0.8\Delta y_{t - 1} - 0.5 \Delta y_{t - 2} + \varepsilon_t Δyt=0.10.8Δyt10.5Δyt2+εt(转换成了一个 AR(2) 过程)
    此时齐次方程对应的特征方程: x 2 = − 0.8 x − 0.5 x^2 = -0.8x - 0.5 x2=0.8x0.5 解得 x 1 = − 4 − 34 i 10 , x 2 = − 4 + 34 i 10 x_1 = \frac{-4 - \sqrt{34}i}{10}, x_2 = \frac{-4 + \sqrt{34}i}{10} x1=10434 i,x2=104+34 i

    对于 AR(p) 模型而言: y t = α 0 + α 1 y t − 1 + α 2 y t − 2 + ⋯ + α p y t − p + ε t y_t = \alpha_0 + \alpha_1y_{t - 1} + \alpha_2y_{t - 2} + \cdots + \alpha_py_{t - p} + \varepsilon_t yt=α0+α1yt1+α2yt2++αpytp+εt (1) { y t } \{y_t\} {yt} 为单位根的充要条件: α 1 + α 2 + ⋯ + α p = 1 \alpha_1 + \alpha_2 + \cdots + \alpha_p = 1 α1+α2++αp=1 (2) { y t } \{y_t\} {yt} 平稳的充分条件: ∣ α 1 ∣ + ∣ α 2 ∣ + ⋯ + ∣ α p ∣ < 1 |\alpha_1| + |\alpha_2| + \cdots + |\alpha_p| < 1 α1+α2++αp<1 (3) { y t } \{y_t\} {yt} 平稳的必要条件: α 1 + α 2 + ⋯ + α p < 1 \alpha_1 + \alpha_2 + \cdots + \alpha_p < 1 α1+α2++αp<1

七、MA(q)模型

q q q 阶移动平均模型(MA(q)模型): y t = ε t + β 1 ε t − 1 + β 2 ε t − 2 + ⋯ + β q ε t − q y_t = \varepsilon_t + \beta_1\varepsilon_{t - 1} + \beta_2\varepsilon_{t - 2} + \cdots + \beta_q\varepsilon_{t - q} yt=εt+β1εt1+β2εt2++βqεtq

  1. MA模型和AR模型之间的关系
    MA(1) 模型: y t = ε t − β 1 ε t − 1 y_t = \varepsilon_t - \beta_1\varepsilon_{t - 1} yt=εtβ1εt1 将上面的式子使用滞后算子的写法为: y t = ( 1 − β 1 L ) ε t ⇒ 1 1 − β 1 L y t = ε t y_t = (1 - \beta_1L)\varepsilon_t \Rightarrow \frac{1}{1 - \beta_1L}y_t = \varepsilon_t yt=(1β1L)εt1β1L1yt=εt又因为 ( 1 − β 1 L ) ( 1 + β 1 L + β 1 2 L 2 + ⋯ ) = ( 1 − β 1 L + β 1 2 L 2 + ⋯ ) − ( β 1 L + β 1 2 L 2 + ⋯ ) = 1 (1 - \beta_1L)(1 + \beta_1L + \beta_1^2L^2 + \cdots) = (1 - \beta_1L + \beta_1^2L^2 + \cdots) - (\beta_1L + \beta_1^2L^2 + \cdots) = 1 (1β1L)(1+β1L+β12L2+)=(1β1L+β12L2+)(β1L+β12L2+)=1所以 1 1 − β 1 L = 1 + β 1 L + β 1 2 L 2 + ⋯ ( 条件: ∣ β 1 ∣ < 1 ) \frac{1}{1 - \beta_1L} = 1 + \beta_1L + \beta_1^2L^2 + \cdots(\text{条件:}|\beta_1| < 1) 1β1L1=1+β1L+β12L2+(条件:β1<1)

    1 1 − β 1 L y t = ε t ⇒ ( 1 + β 1 L + β 1 2 L 2 + ⋯ ) y t = ε t \frac{1}{1 - \beta_1L}y_t = \varepsilon_t \Rightarrow (1 + \beta_1L + \beta_1^2L^2 + \cdots)y_t = \varepsilon_t 1β1L1yt=εt(1+β1L+β12L2+)yt=εt

    所以 y t + β 1 y t − 1 + β 1 2 y t − 2 + ⋯ = ε t ⇒ y t = ε t − β 1 y t − 1 − β 1 2 y t − 2 + ⋯ y_t + \beta_1y_{t - 1} + \beta_1^2y_{t - 2} + \cdots = \varepsilon_t \Rightarrow y_t = \varepsilon_t - \beta_1y_{t - 1} - \beta_1^2y_{t - 2} + \cdots yt+β1yt1+β12yt2+=εtyt=εtβ1yt1β12yt2+

    从上面的例子可以知道,可以将 1 阶移动平均模型转换为无穷阶的自回归模型。之所以需要 MA(q) 模型,是因为在模型分析中我们需要参数尽可能地少,因此需要 MA(q) 模型来帮助我们简化。

  2. MA(q) 模型的平稳性
    只要 q q q 是常数,那么 MA(q) 模型一定是平稳的。

八、ARMA(p, q)模型

自回归移动平均模型就是设法将自回归过程 AR 和移动平均过程 MA 结合起来,共同模拟由时间序列的随机过程。

  1. ARMA(p, q) 模型 y t = α 0 + ∑ i = 1 p α i y t − i + ε t + ∑ i = 1 q β i ε t − i y_t = \alpha_0 + \sum_{i = 1}^{p}\alpha_iy_{t - i} + \varepsilon_t + \sum_{i = 1}^{q}\beta_i\varepsilon_{t - i} yt=α0+i=1pαiyti+εt+i=1qβiεti
  2. ARMA(p, q) 模型的平稳性
    由上述讨论可以知道,对于 MA(q) 模型而言,只要 q q q 大于0,那么 MA(q) 模型平稳。因此,ARMA(p, q) 模型的平稳性只与 AR§ 部分有关。
  3. 如何确定 p, q 的值
    简单的确定 p, q 的值,我们可以作出自相关系数(ACF)和偏自相关系数(PACF)图来确定。
    模型ACFPACF
    AR(p)逐渐衰减,即拖尾p 阶后截尾
    MA(q)q 阶后截尾逐渐衰减,即拖尾
    ARMA(p, q)逐渐衰减,即拖尾逐渐衰减,即拖尾
    例如:在这里插入图片描述
    由图一可得,序列 x 的自相关系数在第 1, 2 阶显著异于 0 ,超过 2 阶后均和 0 没有显著的差异;而其偏自相关系数在第 1, 2, 7, 9, 16 阶显著异于0,且表现出拖尾现象。因此可以得出序列 x 可以由 MA(2) 生成。

九、模型选择:AIC 和 BIC 准则(选小准则)

  1. 赤池信息准则: A I C = 2 ( 模型中参数的个数 ) − 2 ln ⁡ ( 模型的极大似然函数值 ) AIC = 2(\text{模型中参数的个数}) - 2\ln (\text{模型的极大似然函数值}) AIC=2(模型中参数的个数)2ln(模型的极大似然函数值)

  2. 贝叶斯信息准则: B I C = ln ⁡ ( T ) ( 模型中参数的个数 ) − 2 ln ⁡ 模型的极大似然函数值 BIC = \ln(T)(\text{模型中参数的个数}) - 2\ln \text{模型的极大似然函数值} BIC=ln(T)(模型中参数的个数)2ln模型的极大似然函数值

    AIC 和 BIC 是喧嚣原则,我们要选择使得 AIC 或者 BIC 最小的模型。(由于 BIC 对于模型复杂程度的惩罚系数更大,因此通常根据 BIC 来确定模型)

十、检验模型是否识别完全

估计了时间序列模型后,我们需要对残差进行白噪声检验,如果残差是白噪声,则说明模型能够完全识别时间序列数据的规律。
H 0 = ρ 1 = ρ 2 = ⋯ = ρ s = 0 , H 1 : ρ i ( i = 1 , 2 , ⋯ , s ) 中 至 少 有 一 个 不 为 0 H_0 = \rho_1 = \rho_2 = \cdots = \rho_s = 0, H_1: \rho_i(i = 1, 2, \cdots, s)中至少有一个不为 0 H0=ρ1=ρ2==ρs=0,H1:ρi(i=1,2,,s)0 H 0 H_0 H0 成立的条件下,统计量 Q = T ( T + 2 ) ∑ i = 1 s r k 2 T − k χ s − n 2 Q = T(T + 2)\sum_{i = 1}^{s}\frac{r_k^2}{T - k}~\chi_{s - n}^2 Q=T(T+2)i=1sTkrk2 χsn2
软件可以计算出 p p p 值, p p p 值小于 0.05 则可以拒绝原假设,此时模型没有识别完全,需要进行修正。
(1) T T T 表示样本个数
(2) n n n 表示模型中的位置参数
(3) s s s 根据样本量的大小一般可以取 8,16,24 等(SPSS取18)

十一、ARIMA(p, d, q)模型

对于可能是 d d d 阶单位根过程的时间序列,我们需要先对数据进行差分处理,将其转换为平稳的时间序列后再进行建模。

  1. ARIMA(p, d, q) 模型 y t ′ = α 0 + ∑ i = 1 p α i y t − i ′ + ε t + ∑ i = 1 q β i ε t − i y_t' = \alpha_0 + \sum_{i = 1}^{p}\alpha_iy_{t - i}' + \varepsilon_t + \sum_{i = 1}^{q}\beta_i\varepsilon_{t - i} yt=α0+i=1pαiyti+εt+i=1qβiεti y t ′ = Δ d y t = ( 1 − L ) d y t y_t' = \Delta^dy_t = (1 - L)^dy_t yt=Δdyt=(1L)dyt
    所以: ( 1 − ∑ i = 1 p α i L i ) ( 1 − L ) d y t = α 0 + ( 1 + ∑ i = 1 q β i L i ) ε t (1 - \sum_{i = 1}^{p}\alpha_iL^i)(1 - L)^dy_t = \alpha_0 + (1 + \sum_{i = 1}^{q}\beta_iL^i)\varepsilon_t (1i=1pαiLi)(1L)dyt=α0+(1+i=1qβiLi)εt

十二、SARIMA模型

季节性 ARIMA 模型是通过在 ARIMA 模型中包含额外的季节性项而生成的,其形式为: S A R I M A ( p , d , q ) × ( P , D , Q ) m SARIMA(p, d, q)\times(P, D, Q)_m SARIMA(p,d,q)×(P,D,Q)m(m 表示周期数) ( 1 − ∑ i = 1 p ϕ i L i ) ( 1 − ∑ i = 1 P Φ i L m i ) ( 1 − L ) d ( 1 − L m ) D y t = α 0 + ( 1 + ∑ i = 1 q θ i L i ) ( 1 + ∑ i = 1 Q Θ i L m i ) ε t (1 - \sum_{i = 1}^{p}\phi_iL^i)(1 - \sum_{i = 1}^{P}\Phi_iL^{mi})(1 - L)^d(1 - L^m)^Dy_t = \alpha_0 + (1 + \sum_{i = 1}^{q}\theta_iL^i)(1 + \sum_{i = 1}^{Q}\Theta_iL^{mi})\varepsilon_t (1i=1pϕiLi)(1i=1PΦiLmi)(1L)d(1Lm)Dyt=α0+(1+i=1qθiLi)(1+i=1QΘiLmi)εt

十三、时间序列建模思路

  1. 处理缺失值,生成时间变量和时间序列图
  2. 数据是否为季度数据或者月份数据(至少两个完整的周期),判断是否存在季节性波动
  3. 根据时间序列判断数据是否为平稳序列
  4. 使用 SPSS 进行建模
  5. 如果结果是ARIMA(p, 0, q)模型,可以结合 ACF 和 PACF 进行分析;如果结果是ARIMA(p, 1, q)模型,可以先进行 1 阶差分后使用 ACF 和 PACF进行分析;如果结果与季节性相关,可以考虑时间序列分析。
    注意:预测需要结合背景,不要硬套模型哦~~~

如果有什么错误,还请斧正hhh
请添加图片描述


http://chatgpt.dhexx.cn/article/Rrw9d8l1.shtml

相关文章

时间序列模型步骤教程(ARIMA)

目录 0、前言一、数据准备&探索1、平稳性1.1 平稳性检验1.2 数据处理&#xff08;平滑、变换、差分、分解&#xff09;1.2.1 对数变换1.2.2 平滑法&#xff08;移动平均&指数平均&#xff09;1.2.3 差分法1.2.4 分解 2、非白噪声检验 二、模型&#xff08;ARIMA&#x…

时间序列模型分析

目录 一个引言 定义 确定性时间序列分析方法概述 确定性时间序列模型类型 移动平均法 简单移动平均法 加权移动平均法 趋势移动平均法 指数平滑法 一次指数平滑法 1&#xff0e;预测模型​编辑 2&#xff0e;加权系数的选择​编辑 3&#xff0e;初始值的确定​编…

时间序列模型相关说明和模型介绍

一、什么是时间序列? 时间序列是在规律性时间间隔记录的观测值序列。依赖于观测值的频率&#xff0c;典型的时间序列可分为每小时、每天、每周、每月、每季度和每年为单位记录。 import pandas as pd df pd.read_csv(https://raw.githubusercontent.com/selva86/datasets/d…

常用的时间序列模型

白噪声模型 时间序列算法之ARIMA模型 对非平稳时间序列的分析方法可以分为确定性因素分解的时序分析和随机时序分析两个大类。 确定性因素分解的方法把所有序列的变化都归结为4个因素&#xff1a;长期趋势、季节变动、循环变动和随机波动。其中长期趋势和季节变动的规律性信息通…

数学建模之时间序列模型及其应用

摘要 时间序列模型就是将预测对象按照时间顺序排列起来,用这一组时间序列过去的变化规律,推断今后变化的可能性及变化趋势、变化规律。 时间序列模型也是一种回归模型,其一方面承认事物发展的延续性,运用过去的数据来推测事物的发展趋势;另一方面又考虑到偶然因素产生的随机性…

集成时间序列模型提高预测精度

使用Catboost从RNN、ARIMA和Prophet模型中提取信号进行预测 集成各种弱学习器可以提高预测精度&#xff0c;但是如果我们的模型已经很强大了&#xff0c;集成学习往往也能够起到锦上添花的作用。流行的机器学习库scikit-learn提供了一个StackingRegressor&#xff0c;可以用于…

时间序列规则和时间序列模型

1. 时间序列规则 1.1 什么是时间序列规则 对于赛题/业务的规则之前已经描述了它的重要性和应用&#xff0c;在此不再赘述。这章主要了解时间序列及其规则&#xff0c;和周期的应用。 1.1.1 时间序列 时间序列&#xff08;或称动态数列&#xff09;&#xff1a;指将同一统计…

时间序列模型算法 - Prophet,LSTM(二)

时间序列模型 - Prophet 1.时间序列简介1.1 时间序列 - 平稳性检验1.1.1 log法1.1.2 差分法 1.2 平稳性的单位根检验 2.ARIMA3.Prophet3.1 Prophet的优点3.2 安装Prophet3.3 数据处理3.4 预测 4.LSTM4.1 数据处理4.2 训练预测 1.时间序列简介 在做时间序列时&#xff0c;首先要…

时间序列模型-ARIMA

一、ARIMA模型基本概念 1.1 自回归模型&#xff08;AR&#xff09; 描述当前值与历史值之间的关系&#xff0c;用变量自身的历史数据对自身进行预测&#xff1b;自回归模型必须满足平稳性的要求&#xff1b;&#xff08;何为平稳性&#xff1a;见时间序列数据分析基本概念&am…

ARMA 时间序列模型

更好的理解协方差以及相关系数 ###X因素和Y因素协方差公式&#xff1a; 自相关系数ACF 直观上来说&#xff0c;ACF 描述了一个观测值和另一个观测值之间的自相关&#xff0c;包括直接和间接的相关性信息。 其实自相关系数可以这么理解&#xff1a;把一列数据按照滞后数拆成两…

时间序列模型简介

时间序列模型简介 尽管此前我们已经用到了time series这个专业名词&#xff0c;但我们对时序特征进行的处理&#xff0c;并不是time series这个专业名词所代表的真正含义&#xff0c;既时间序列。尽管本阶段我们并不会讲解时间序列模型&#xff0c;但既然讨论了时序特征&#x…

时间序列的7种预测模型

背景 时间序列问题比较常见&#xff0c;比如股市&#xff0c;工业生产指标等。 导入必要的Python包&#xff1a; from statsmodels.tsa.api import ExponentialSmoothing, \ SimpleExpSmoothing, Holtimport statsmodels.api as sm1. 朴素估计 y ^ t 1 y t \hat{y}_{\math…

算法模型---时间序列模型

文章来源 时间序列 时间序列是时间间隔不变的情况下收集的不同时间点数据集合&#xff0c;这些集合被分析用来了解长期发展趋势及为了预测未来。 时间序列与常见的回归问题的不同点在于: 1、时间序列是跟时间有关的;而线性回归模型的假设&#xff1a;观察结果是独立的在这种情…

ADF单位根检验三种形式_[STATA] 时间序列模型 ARIMA检验

___ ____ ____ ____ ____ (R) /__ / ____/ / ____/___/ / /___/ / /___/ 13.1 Statistics/Data Analysis 此次系列文章的主题是通过Stata软件来分析时间序列的平稳和非平稳关系,以及如何通过Stata软件来进行不同时间序列模型的预测性分析。…

机器学习——时间序列模型

文章目录 1. 基本概念1.1 自相关函数ACF&#xff08;autocorrelation function&#xff09;1.2 偏自相关函数PACF&#xff08;partial autocorrelation function&#xff09; 2. 常见模型2.1 自回归模型&#xff08;AR&#xff09;2.2 移动平均模型&#xff08;MA&#xff09;2…

时间序列模型算法 - ARIMA (一)

时间序列模型 1.时间序列模型概述1.1 时间序列的不同分类1.2 确定性时间序列分析方法概述1.3 三种时间序列模型 2.指标平滑ES2.1 一次指数平滑法 3.ACF与PACF4.AR5.MA6.ARMA7.ARIMA7.1 差分 8. ARIMA实践8.1 读取数据8.2 画图&#xff0c;观察数据是否非平稳8.3 差分&#xff0…

Office 2016 定制安装工具 v1.0 | Office 2016 自定义安装组件

软件简介 以往Office的安装包都采用的是MSI安装器&#xff0c;允许用户在安装时选择安装的组件&#xff0c;但是微软发布的Office2016安装包只提供了C2R&#xff08;ClickToRun&#xff09;方式&#xff0c;因此默认情况下用户无法选择安装组件&#xff0c;默认会安装所有。大…

office2016激活后还显示激活页面的解决办法

win10系统的office16通过Office激活工具激活之后&#xff0c;但是打开之后还会出现提示“让我们开始吧”的激活的页面&#xff0c; 1.office2016激活后还显示激活页面的解决办法 以后激活之后&#xff0c;每次试用Word或者Excel的时候&#xff0c;都会出现上图的激活提示页面…

运维 office2016自定义安装

office2016自定义安装组件简明教程 引言 以往Office的安装包都采用的是MSI安装器&#xff0c;允许用户在安装时选择安装的组件&#xff0c; 但是微软发布的Office 2016安装包只提供了C2R&#xff08;ClickToRun&#xff09;方式&#xff0c;因此默认情况下用户无法选择安装组…

安装Office的一些工具

1.可以下载各个版本的office&#xff1a;https://msdn.itellyou.cn/ 这个站点经常装系统的朋友应该都知道&#xff0c;一个老站了。 2.部署工具Office Tool Plus&#xff1a;https://otp.landian.vip/zh-cn/ 这个工具挺强大的&#xff0c;可以下载&#xff0c;可以部署&…