基础时间序列分析(统计学分析)

数理统计知识

  • 原点矩:令k为正整数(或为0),a为任何实数,X为随机变量,则期望值E((Xa)k)E\left((X-a)^{k}\right) 叫做随机变量X对a的k阶矩。如果a=0,则有E(Xk),叫做k阶原点矩,记作vk(X)v_{k}(X) ,也叫k阶矩。

    vk(X)=E(Xk),k=1,2,v_{k}(X)=E\left(X^{k}\right), k=1,2, \ldots

    显然,一阶原点矩就是数学期望,即v1(X)=E(X)v_{1}(X)=E(X)

原点矩在几何意义上可以看做随机变量到原点的距离的均值

  • 中心距:设随机变量X的函数[XE(X)]k(k=1,2,)[X-E(X)]^{k}(k=1,2, \ldots) 的数学期望存在,则称

    E{[XE(X)]k}E\left\{[X-E(X)]^{k}\right\} 为X的k阶中心矩**,**记作μk(X)\mu_{k}(X),即

μk(X)=E{[XE(X)]k},k=1,2, \mu_{k}(X)=E\left\{[X-E(X)]^{k}\right\}, k=1,2, \ldots

易知,一阶中心矩恒等于零,即

μ1(X)0\mu_{1}(X) \equiv 0

;二阶中心矩就是方差,即

μ2(X)=D(X) \mu_{2}(X)=D(X)

中心矩在几何意义上可以看做随机变量到均值点的距离的均值

  • 协方差:用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况

    期望值分别为E[X]与E[Y]的两个实随机变量XY之间的协方差 *Cov(X,Y)*定义为:

  • 自协方差:特定时间序列或者连续信号Xt的自协方差是信号与其经过时间平移的信号之间的协方差。如果序列的每个状态都有一个平均数E[Xt]=μt,那么自协方差为

    γ(i,j)=E[(Xiμi)(Xjμj)]\gamma(i, j)=E\left[\left(X_{i}-\mu_{i}\right)\left(X_{j}-\mu_{j}\right)\right]

时间序列

定义

时间序列就是一组随机变量X(t),在一系列时刻t1,t2,t3,···tn上的一次样本实现xt1,xt2,xt3···xtn.

  • 在任意一个时刻只有一个观察值
  • 时间序列分析强调变量值的顺序性的重要性
  • 时序观察值之间一般存在一定的依存关系
  • 时间序列可以分析自身的变化规律来进行预测

平稳时间序列

定义

平稳时间序列分为严平稳和宽平稳

  • 严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。

  • 宽平稳是使用序列的特征统计量来定义的一种平稳性.它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定.

平稳时间序列的性质

  • 均值为常数

  • 方差存在且为常数

  • 自协方差函数和自相关系数只依赖于时间的平移长度而与时间的起止点无关。即:$ \gamma (t,s) = \gamma (k,k + s - t) $

    根据这个性质,可以将二维函数简化为一维函数: γ(st)γ(t,s)\gamma(s-t) \triangleq \gamma(t, s)

  • 延迟k自协方差函数:γ(k)=γ(t,t+k)\gamma (k) = \gamma (t,t + k)

    延迟k自相关系数:ρk=γ(t,t+k)DXtDXt+k=γ(k)γ(0)\rho_{\mathrm{k}}=\frac{\gamma(t, t+k)}{\sqrt{D X_{t} D X_{t+k}}}=\frac{\gamma(k)}{\gamma(0)}

平稳时间序列的意义

  • 常数均值性使得原来Xt的均值μt\mu_{\mathrm{t}}由唯一的观察值xt去估计,变成了常数均值μ\mu由样本观测值x1,x2,xt去估计。即 μ^=x¯=1ni=1nxi\hat{\mu}=\bar{x}=\frac{1}{n} \sum_{i=1}^{n} x_{i}
  • 延迟k自协方差函数估计值

平稳性检验

  • 一般呈趋势性或者周期性的时间序列是非平稳的时间序列

  • 自相关图检验acf

    随着延迟阶数k的增加,平稳的自相关系数ρk\rho_{\mathrm{k}}会很快衰减向零(在两倍标准差之内)

纯随机性检验

纯随机序列

纯随机序列也叫白噪声序列,他满足以下两条性质

(1)EXt=μ(1) \mathrm{EX}_{\mathrm{t}}=\mu

(2)γ(t,s)={σ2,t=s0,ts(2) \gamma(t, s)=\left\{\begin{array}{l}\sigma^{2}, t=s \\ 0, t \neq \mathrm{s}\end{array}\right.

对于任意两个不同时刻,他们之间是没有自相关关系的

  • 白噪声序列是最简单的平稳序列

纯随机序列性质

  • 纯随机性
  • 方差齐性

检验

常用LB统计量:

LB=n(n+2)k+1m(ρ^k2nk)LB = n(n + 2)\sum\limits_{k + 1}^m {(\frac{ {\hat \rho _k^2}}{ {n - k}})}

在R中使用Box.test(var,lag=6,type="Ljung-Box")

平稳时间序列分析

差分运算

  • 一阶差分
  • 二阶差分
  • p阶差分

k步差分

延迟算子

  • 定义:延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间过去拨了一个时刻

  • 记B为延迟算子,有

    xt1=Bxtxt2=B2xtxtp=Bpxt\begin{aligned} \mathrm{x}_{t-1} &=B x_{t} \\ \mathrm{x}_{t-2} &=B^{2} x_{t} \\ \mathrm{x}_{t-p} &=B^{p} x_{t} \end{aligned}

线性差分方程

AR模型

定义

自回归模型(英语:Autoregressive model,简称AR模型),是统计上一种处理时间序列的方法,用同一变数x之前各期,即x1至xt-1来预测本期xt的表现,并假设它们为一线性关系。因为这是从回归分析中的线性回归发展而来,只是不用x预测y,而是用x预测 x(自己);所以叫做自回归。

具有如下结构的模型成为p阶自回归模型,简记为AR§:

下面三个限制条件表示:

  • 模型的最高阶为p
  • 随机干扰序列{εt{\varepsilon _t}}为零均值白噪声序列
  • 当期的随机干扰与过去的序列无关

ϕ0\phi_{0}等于0时,自回归模型又称为中心化AR§模型。

引入延迟算子,中心化AR§模型又可以表示为:

Φ(B)xt=εt,Φ(B)=1ϕ1Bϕ2B2ϕpBp\Phi(B) x_{t}=\varepsilon_{t}, \Phi(B)=1-\phi_{1} B-\phi_{2} B^{2}-\cdots-\phi_{p} B^{p}

平稳性判别

AR模型是常用的平稳序列拟合模型之一,但并非所有的AR模型都是平稳的

  • 时序图判别法

  • 特征根判别法

    平稳AR模型的每个特征根绝对值小于1

  • 平稳域判别

    ϕ1,ϕ2ϕp\phi_{1}, \phi_{2} \cdots \phi_{p} |特征根都在单位圆内

平稳AR模型的性质

  • 均值 μ=ϕ01ϕ1ϕp\mu=\frac{\phi_{0}}{1-\phi_{1}-\cdots-\phi_{p}}

    对于中心化的AR§模型,均值为0

  • 方差

    • AR(1)模型

      Gj={1,j=0ϕ1j,j>1Var(xt)=σε21ϕ12\begin{array}{l} {G_j} = \left\{ \begin{array}{l} 1,j = 0\\ \phi _1^j,j > 1 \end{array} \right.\\ Var({x_t}) = \frac{ {\sigma _\varepsilon ^2}}{ {1 - \phi _1^2}} \end{array}

    • AR§模型

      Gj={1,j=0k=11ϕkGjk,j1ϕk={ϕk,kp0,k>pVar(xt)j=0Gj2σε2\begin{array}{l} {G_j} = \left\{ \begin{array}{l} 1,j = 0\\ \sum\limits_{k = 1}^1 { { {\phi '}_k}{G_{j - k}}} ,j \ge 1 \end{array} \right.\\ { {\phi '}_k} = \left\{ \begin{array}{l} {\phi _k},k \le p\\ 0,k > p \end{array} \right.\\ Var({x_t})\sum\limits_{j = 0}^\infty {G_j^2\sigma _\varepsilon ^2} \end{array}

  • 自协方差函数

    γk=ϕ1γk1+ϕ2γk2++ϕpγkp\gamma_{k}=\phi_{1} \gamma_{k-1}+\phi_{2} \gamma_{k-2}+\cdots+\phi_{\mathrm{p}} \gamma_{k-p}

    • AR(1)

      γk=ϕ1kσε21ϕ12{\gamma _k} = \phi _1^k\frac{ {\sigma _\varepsilon ^2}}{ {1 - \phi _1^2}}

    • AR(2)

      {γ0=1ϕ2(1+ϕ2)(1ϕ1ϕ2)(1+ϕ1ϕ2)γ1=ϕ1γ01ϕ2γk=ϕ1γk1+ϕ2γk2,k2\left\{\begin{array}{l}\gamma_{0}=\frac{1-\phi_{2}}{\left(1+\phi_{2}\right)\left(1-\phi_{1}-\phi_{2}\right)\left(1+\phi_{1}-\phi_{2}\right)} \\ \gamma_{1}=\frac{\phi_{1} \gamma_{0}}{1-\phi_{2}} \\ \gamma_{k}=\phi_{1} \gamma_{k-1}+\phi_{2} \gamma_{k-2}, \quad k \geq 2\end{array}\right.

  • 自相关系数

分段 分类 预测 符号化

评论