600 likes | 797 Vues
时间序列建模中的有关问题. 王明进 教授 北京大学光华管理学院 2010 年 7 月. 主要目的. 主要针对在以往的一些参赛作品或者学术研究论文中进行时间序列建模时存在的一些概念性、技术性的问题进行讨论。. 主要内容. 平稳性的讨论; 长期方差的估计; 白噪声的检验; 单位根的检验; 其他话题;. 1. 平稳性的讨论. 平稳过程及自相关函数. 平稳性:严平稳和弱平稳; 自协方差函数和自相关函数:. 平稳过程的谱函数. 谱密度函数是定义在 上的偶函数 如果自协方差函数绝对可加,谱密度函数连续且能够写成. 无条件和条件分布.
E N D
时间序列建模中的有关问题 王明进 教授 北京大学光华管理学院 2010年7月
主要目的 主要针对在以往的一些参赛作品或者学术研究论文中进行时间序列建模时存在的一些概念性、技术性的问题进行讨论。
主要内容 • 平稳性的讨论; • 长期方差的估计; • 白噪声的检验; • 单位根的检验; • 其他话题;
平稳过程及自相关函数 • 平稳性:严平稳和弱平稳; • 自协方差函数和自相关函数:
平稳过程的谱函数 • 谱密度函数是定义在 上的偶函数 • 如果自协方差函数绝对可加,谱密度函数连续且能够写成
无条件和条件分布 • 平稳性针对的是无条件分布的特征不随时间变化; • 各种时间序列模型往往是给出的是具体的条件分布,条件分布的一些特征必须是随时间变化的, • 预测的基础是条件分布。
白噪声过程 • 如果一个过程 满足 • 称其为白噪声(White Noise), 白噪声过程总是平稳的, 此时
鞅差过程 • 如果一个过程满足 • 称其为鞅差(Martingale-Difference)过程,鞅差不一定是平稳的,除非
ARMA过程 • ARMA(p,q)模型 • 其中 是白噪声
ARMA模型的平稳性 • 如果 ,那么ARMA模型定义了唯一的二阶平稳过程
ARMA模型的可逆性 • 如果 ,那么ARMA模型能够唯一地表达成如下的形式 • 此时,
ARMA模型的自相关特征 • 任何一个平稳的ARMA模型的自相关函数都是呈指数递减的,即 • 平稳ARMA过程的自相关函数是绝对可和的。
ARMA模型的谱密度函数 • 于是
GARCH模型 • 条件方差模型: • GARCH(1,1)模型的形式: • 条件分布形式
GARCH模型的平稳性 • GARCH模型表达的是鞅差过程,但不一定是平稳的; • 如果 ,那么GARCH(1,1)模型能够表达唯一的二阶平稳过程,此时
高阶的关联性 • GARCH模型表达了二阶的关联;GARCH(1,1)模型可以写成平方项的ARMA(1,1)的形式
多维时间序列模型 • 向量白噪声; • 向量鞅差序列; • VARMA模型; • 多维GARCH模型
讨论几个问题 • 先对一些宏观经济或者金融的变量数据进行统计描述,计算其平均值等,再检验其存在单位根; • 根据几种经济变量的时间序列数据采用主成分分析、因子分析等方法进行综合评价(比如竞争力评价等)?
无条件相关和条件相关 • 通过移动窗研究多个时间序列之间的相关性; • 主成分和条件不相关成分的问题(Fan, Wang & Yao 2008)
对均值的估计 • 假设一个平稳序列 的均值 ,那么样本平均值 显然是无偏的估计,估计的误差?
长期方差(long-run variance) 如果存在极限 那么称其为该时间序列的长期方差 ,此时
长期方差的性质 • 如果自协方差函数绝对可加,那么长期方差存在且满足 • 对于白噪声的情形才有
多维的情形 • 长期协方差矩阵:
长期方差的非参数估计 • HACC (Heteroskedasticity and Autocorr- elation Consistent Covariance matrix ) • 非参数估计方法:估计谱密度函数在零点的值。 Newey &West(1987); Andrews(1991); Andrews & Monahan (1992) ; Newey & West (1994).
Newey-West估计 • Newey-West(1987)
长期方差的参数估计 • 对数据拟合一个ARMA模型,利用 • 特别地,拟合一个AR(p)模型,利用
长期方差的应用 • 计算各种涉及到时间序列相关性的统计量,比如检验单位根时的一些统计量、检验长记忆时的一些统计量等; • 如果模型设置得并不充分,比如误差项里面可能存在着某种自相关性时,计算模型参数估计值的误差时就应考虑到这种自相关性。
长期方差不存在的情形 • 长记忆过程: 自相关函数存在但是不可无穷相加; • 非平稳过程:自相关函数不存在或者难以按照常规的方式定义。
ARMA模型的建模思路 • 通过自相关函数识别模型的结构初步判断模型的阶数;如果是白噪声,不需要建立模型; • 估计模型中的参数; • 对残差数据进行诊断;如果残差已经是白噪声,就不需要再改变模型的设置;
对白噪声的Q检验 • 根据独立同分布(i.i.d.)情形下样本自相关函数的渐近分布,构造Q统计量 • 检验“时间序列是白噪声”的假设。采用的渐近分布是i.i.d.假设下的
Q检验用于模型诊断 • 如果对数据拟合了一个ARMA(p,q)模型之后,可以通过对残差进行Q检验来诊断模型的设置是否充分。 • 注意此时不管模型当中是否考虑了常数项,Q统计量的渐近分布都是
Q检验的局限性 • Q统计量的渐近分布来自于“独立性”的假设,如果时间序列存在着某种高阶的关联性,那么Q统计量的卡方分布性质就存在问题; • 很多金融数据当中就存在着明显的二阶关联性。
一个模拟分析 • 从如下GARCH(1,1)模型中产生随机序列,计算其QLB(10),并与自由度为10的卡方分布的分位数进行比较; • 重复5000次;在5%的水平下拒绝“白噪声”原假设的比率是37.2%,在10%的水平下拒绝原假设的比率是46.84%.
原因分析 样本自相关函数的渐近方差依赖于更高阶过程的关联性,此处是 的长期协方差
一种修正的Q检验 • Lobato, Nankervis, Savin (2002):考虑对长期协方差矩阵C的估计,并由此构造Q统计量QLNS ; • 同前面的模拟分析,在5%的显著水平下, 按照QLNS (10)的结果拒绝白噪声假设的比率为4.3%,在10%的显著水平下的拒绝比率为9.36%.