dx sm:最近研究的几个方向看似跟内控没有关系?
5.3 衡量VAR的精度
本节介绍如何估算衡量VAR的重要参数,如何从实际数据中得出均值、标准差、分位数值。但是这些估计值的正确性,不应该被想当然地一味接受。这些参数受到估算误差(estimation error)的影响,即由于样本数据量的局限性自然而然带来的波动问题。增加新的观察数据会改变结果,我们关心的问题是改变多少。
通常VAR数据在通报给公众时,常保留至小数点后面好几位。这不仅看起来愚蠢,而且有害。给人留下错误印象貌似估算的VAR非常精准,而实际情况并非如此。本节介绍在考虑样本数据变动情况下,如何围绕VAR值确定不同的置信区段(confidence bands)。
5.3.1 衡量误差的问题
从VAR使用者的角度看,评估VAR的准确性是非常有用的。在前面的例子中,每日的VAR是1,500万美元。问题是,管理层对这一估值有多大的信心?我们能否认为,例如,我们有95%的把握风险值在1,400万~1,600万美元之间,还是可能在500万~2500万美元之间。这两种置信区段反映了完全不同的VAR情况,第一种非常精确,第二种说服力弱,尽管告诉我们风险值没有上亿。
VAR或者任何统计数值 ,都是从固定时间窗口 天内选择估算的。得出根据样本实际规模和实际事件发生情况估算的 。报告统计得出的 ,只是真实价值的一个估算值,受样本变动的影响。换句话说,选择不同的样本观察时间段窗口时间 或者实际事件发生情况,将得出不同的VAR值。
对这种估值的一种解释是(“频率论”统计学家的观点),这种估值代表了一种未知参数分布的样本值。对于具有无穷大观察值 ,和一个完善稳定系统的样本观察,估值应该接近实际值。实际中,样本规模有限,一些金融数据可能相对较近,或者结构变化造成追溯太久远的历史数据毫无意义。由于一些估算误差总是存在的,价值的自然偏差,指标 ,可以通过样本分布得出。这可以用来确定估算VAR确定的置信区段,这和VAR置信水平没有任何关系。
5.3.2 均值及方差中的估值误差
当研究对象的分布呈正态,样本分布准确的均值和方差是已知的。估计的均值 围绕实际均值呈正态分布:
其中, 是样本中的独立观察数值。注意,标准误差在估算均值时,随着 增加,以 时间速度趋于0,这种结果很典型。
对于估算的方差 ,其比率服从自由度为 的卡方分布:
对于样本偏差,其大量样本中标准误差为:
当然,我们不知道计算中 的真实值,但是我们可以使用估计值。我们可以使用这一结果针对个点确定置信区段,假设正态分布两尾置信水平在95%,将 乘以1.96.
例如,分析1973年至2004年欧元兑美元的月度回报。样本参数 , ,观察事件 。估值的标准误差表明,我们对样本值有多大把握。误差越小,我们信心更足。 的标准误差是 。因此, 点估值=-0.15%,小于一个偏离0的标准误差。我们即使用26年的数据, 的衡量值仍不是很准。
相比较而言, 的一个标准误差是 。因为这一数字和估计的3.39%比相对较小,我们可以得出波动性估算的准确性比估算的预期回报高,这给了我们使用VAR的信心。另一种方法是,围绕着估算点 的95%置信水平,我们可以计算得出(3.39-1.96×0.12,3.39+1.96×0.12)=[3.15, 3.63],相差幅度相当小。
随着样本规模的扩大,估值的准确性也在增加。为了说明这一点,图5.6描述了95%置信区段下,在假设每日真实的波动率为1%时,围绕着不同样本规模的波动率。
选择20天交易日或者1个月为样本观察时间段,置信区段相当不准确,上下区域在[0.69%, 1.31%]。选择1年的样本观察时间段,上下区域为[0.91%, 1.08%]。随着样本观察时间段天数的增加,置信区段缩短,在10年的时候,上下幅度缩小到[0.97%, 1.03%]。因此,样本观察时间段越长,估算结果应该越和真实数值接近。
这一例子可以用于估算以西格玛为基础的分位数置信区段,即:
例如,正态分布和95%VAR置信水平, 。 的置信区段为通过将置信波段 乘以1.645。这种方法也适用于其他统计中,如基于波动率预期的尾部损失。
5.3.3 样本分位数的估算误差
对于任意分布, 值下的分位数,可以通过实证分布得出,记为 。这种方法是非数值法。如同前面提到的,这种统计方法也存在样本误差。肯德尔(Kendall,1994)总结提出 渐近线(asymptotic)标准误差为:
其中, 是样本规模, 是对分数 估算的概率分布函数。估算误差产生的影响如图5.7所示,预期的分位数和95%的置信区段,根据正态分布绘出分位数结果。
对于正态分布,5%左尾端区间以1.645为中心。当 ,置信区段是[1.24, 2.04],相当大。对于250个观察事件,相当于一年的交易天数,波段仍为[1.38, 1.91]。在 时,或者为5年的数据,区段缩小至[1.52, 1.76]。
当趋向于分位数极值时,区段会显著增大。1%的分位数预期价值为2.33.用一年的数据,得出区段为[1.85, 2.80],这一数据是真实值的60%。不确定性区间大约是5%区段的两倍。一年数据,区段为[1.85, 2.80],是实际值的41%。对于1,000个观察值,或者是4年的数据,区段为[2.09, 2.56],为实际值的20%。因此,样本分位数随着左尾的远去可靠性失真。对于低端的左尾概率就更不准确,这是因为观察事件数量更少的原因,这也是为什么用VAR衡量非常高的置信水平时,应该审慎使用。
实际工作中,当研究对象的分布 未知,等式(5.17)在使用上有其局限性。但是,标准误差可以通过数据逼近法(bootstrapping)加以衡量。这种方法包括重新取样,替换 观察事件和重新计算分位数值。将这种方法反复计算 遍,得出样本百分位数的分布,我们可以用这一分布评估原有估值的准确性。克瑞斯欧弗森(Christoffersen)和冈卡尔夫(Goncalves)2005年介绍了这一方法,该方法也可以用于估算预期的尾部(ETL)损失。他们介绍ETL的估算误差比VAR的误差要高很多。对于正态分布,在99%的置信水平,标准误差大于20%,当分布具有厚尾时误差更严重。直观看来,我们可以根据ETL主要的观察小事件的平均值,在价值上可能有大的摇摆。
5.3.4 各方法比较
到目前为止,我们已经讨论了两种衡量分布的VAR值:(1)通过直接从分布 中读取分位数;(2)通过计算标准差并将数值乘以相应的系数 。我们关注的问题是,是否一种方法比另一种更好。
凭直觉,以数值 为基础的方法应该更为准确。事实上, 代表的信息是关于全部分布(就围绕均值的标准差平方而言),而分位数法则仅用列出的观察值,和围绕估值的两个观察值。在正态分布中,我们明确指导如何将 通过 转换成估计值分位数。对于其他分布, 的价值可能不同,但是因为标准差使用所有样本信息,所以我们仍然可以预期业绩能有所提升。
表5.4比较了95%置信区段内的两种方法。基于 的方法得出的效益收益结果明显高于样本分位数。例如,样本VAR在95%置信水平,围绕1.65的分位数区段为[1.38, 1.91]。对 而言,这一区段减小到[1.50, 1.78],和前一区间相比更窄。
从这些数字中,我们可以得出一些重要的结论。第一,尤其在置信水平很高时,估计分位数存在很大估计误差,这和小样本事件自身难以检验特点有关;第二,参数方法(数值法)本身更为精确,因为和样本分位数比较起来,样本的标准差能提供更多的信息。问题是,如何选择合适的分布。
回到本章开始时提到的VAR值为1,520万美元的例子中,我们现在可以评估这一数字的准确性。使用以正态分布为基础的数值法,该值的标准误差为 万美元。因此,围绕VAR估值的双标准误差置信区段为[1,380万美元,1,660万美元]。这种窄间隔应该表明了VAR估值还是很有说服力的。
以上摘自《风险价值VAR》.中信出版社. 2010. 【美】菲利普·乔瑞(Philippe Jorion) |