如何衡量风险价值VAR的精度？

如何衡量风险价值VAR的精度？

期权匿名回答 · 2023-2-11 02:56:06

dx sm：最近研究的几个方向看似跟内控没有关系?

5.3 衡量VAR的精度

本节介绍如何估算衡量VAR的重要参数，如何从实际数据中得出均值、标准差、分位数值。但是这些估计值的正确性，不应该被想当然地一味接受。这些参数受到估算误差（estimation error）的影响，即由于样本数据量的局限性自然而然带来的波动问题。增加新的观察数据会改变结果，我们关心的问题是改变多少。
通常VAR数据在通报给公众时，常保留至小数点后面好几位。这不仅看起来愚蠢，而且有害。给人留下错误印象貌似估算的VAR非常精准，而实际情况并非如此。本节介绍在考虑样本数据变动情况下，如何围绕VAR值确定不同的置信区段（confidence bands）。
5.3.1 衡量误差的问题

从VAR使用者的角度看，评估VAR的准确性是非常有用的。在前面的例子中，每日的VAR是1,500万美元。问题是，管理层对这一估值有多大的信心？我们能否认为，例如，我们有95%的把握风险值在1,400万~1,600万美元之间，还是可能在500万~2500万美元之间。这两种置信区段反映了完全不同的VAR情况，第一种非常精确，第二种说服力弱，尽管告诉我们风险值没有上亿。
VAR或者任何统计数值，都是从固定时间窗口天内选择估算的。得出根据样本实际规模和实际事件发生情况估算的。报告统计得出的，只是真实价值的一个估算值，受样本变动的影响。换句话说，选择不同的样本观察时间段窗口时间或者实际事件发生情况，将得出不同的VAR值。
对这种估值的一种解释是（“频率论”统计学家的观点），这种估值代表了一种未知参数分布的样本值。对于具有无穷大观察值，和一个完善稳定系统的样本观察，估值应该接近实际值。实际中，样本规模有限，一些金融数据可能相对较近，或者结构变化造成追溯太久远的历史数据毫无意义。由于一些估算误差总是存在的，价值的自然偏差，指标，可以通过样本分布得出。这可以用来确定估算VAR确定的置信区段，这和VAR置信水平没有任何关系。
5.3.2 均值及方差中的估值误差

当研究对象的分布呈正态，样本分布准确的均值和方差是已知的。估计的均值围绕实际均值呈正态分布：
其中，是样本中的独立观察数值。注意，标准误差在估算均值时，随着增加，以时间速度趋于0，这种结果很典型。
对于估算的方差，其比率服从自由度为的卡方分布：
对于样本偏差，其大量样本中标准误差为：
当然，我们不知道计算中的真实值，但是我们可以使用估计值。我们可以使用这一结果针对个点确定置信区段，假设正态分布两尾置信水平在95%，将乘以1.96.
例如，分析1973年至2004年欧元兑美元的月度回报。样本参数，，观察事件。估值的标准误差表明，我们对样本值有多大把握。误差越小，我们信心更足。的标准误差是。因此，点估值=-0.15%，小于一个偏离0的标准误差。我们即使用26年的数据，的衡量值仍不是很准。
相比较而言，的一个标准误差是。因为这一数字和估计的3.39%比相对较小，我们可以得出波动性估算的准确性比估算的预期回报高，这给了我们使用VAR的信心。另一种方法是，围绕着估算点的95%置信水平，我们可以计算得出(3.39-1.96×0.12，3.39+1.96×0.12)=[3.15, 3.63]，相差幅度相当小。
随着样本规模的扩大，估值的准确性也在增加。为了说明这一点，图5.6描述了95%置信区段下，在假设每日真实的波动率为1%时，围绕着不同样本规模的波动率。

选择20天交易日或者1个月为样本观察时间段，置信区段相当不准确，上下区域在[0.69%, 1.31%]。选择1年的样本观察时间段，上下区域为[0.91%, 1.08%]。随着样本观察时间段天数的增加，置信区段缩短，在10年的时候，上下幅度缩小到[0.97%, 1.03%]。因此，样本观察时间段越长，估算结果应该越和真实数值接近。
这一例子可以用于估算以西格玛为基础的分位数置信区段，即：
例如，正态分布和95%VAR置信水平，。的置信区段为通过将置信波段乘以1.645。这种方法也适用于其他统计中，如基于波动率预期的尾部损失。
5.3.3 样本分位数的估算误差

对于任意分布，值下的分位数，可以通过实证分布得出，记为。这种方法是非数值法。如同前面提到的，这种统计方法也存在样本误差。肯德尔（Kendall，1994）总结提出渐近线（asymptotic）标准误差为：
其中，是样本规模，是对分数估算的概率分布函数。估算误差产生的影响如图5.7所示，预期的分位数和95%的置信区段，根据正态分布绘出分位数结果。

对于正态分布，5%左尾端区间以1.645为中心。当，置信区段是[1.24, 2.04]，相当大。对于250个观察事件，相当于一年的交易天数，波段仍为[1.38, 1.91]。在时，或者为5年的数据，区段缩小至[1.52, 1.76]。
当趋向于分位数极值时，区段会显著增大。1%的分位数预期价值为2.33.用一年的数据，得出区段为[1.85, 2.80]，这一数据是真实值的60%。不确定性区间大约是5%区段的两倍。一年数据，区段为[1.85, 2.80]，是实际值的41%。对于1,000个观察值，或者是4年的数据，区段为[2.09, 2.56]，为实际值的20%。因此，样本分位数随着左尾的远去可靠性失真。对于低端的左尾概率就更不准确，这是因为观察事件数量更少的原因，这也是为什么用VAR衡量非常高的置信水平时，应该审慎使用。
实际工作中，当研究对象的分布未知，等式（5.17）在使用上有其局限性。但是，标准误差可以通过数据逼近法（bootstrapping）加以衡量。这种方法包括重新取样，替换观察事件和重新计算分位数值。将这种方法反复计算遍，得出样本百分位数的分布，我们可以用这一分布评估原有估值的准确性。克瑞斯欧弗森（Christoffersen）和冈卡尔夫（Goncalves）2005年介绍了这一方法，该方法也可以用于估算预期的尾部（ETL）损失。他们介绍ETL的估算误差比VAR的误差要高很多。对于正态分布，在99%的置信水平，标准误差大于20%，当分布具有厚尾时误差更严重。直观看来，我们可以根据ETL主要的观察小事件的平均值，在价值上可能有大的摇摆。
5.3.4 各方法比较

到目前为止，我们已经讨论了两种衡量分布的VAR值：（1）通过直接从分布中读取分位数；（2）通过计算标准差并将数值乘以相应的系数。我们关注的问题是，是否一种方法比另一种更好。
凭直觉，以数值为基础的方法应该更为准确。事实上，代表的信息是关于全部分布（就围绕均值的标准差平方而言），而分位数法则仅用列出的观察值，和围绕估值的两个观察值。在正态分布中，我们明确指导如何将通过转换成估计值分位数。对于其他分布，的价值可能不同，但是因为标准差使用所有样本信息，所以我们仍然可以预期业绩能有所提升。
表5.4比较了95%置信区段内的两种方法。基于的方法得出的效益收益结果明显高于样本分位数。例如，样本VAR在95%置信水平，围绕1.65的分位数区段为[1.38, 1.91]。对而言，这一区段减小到[1.50, 1.78]，和前一区间相比更窄。

从这些数字中，我们可以得出一些重要的结论。第一，尤其在置信水平很高时，估计分位数存在很大估计误差，这和小样本事件自身难以检验特点有关；第二，参数方法（数值法）本身更为精确，因为和样本分位数比较起来，样本的标准差能提供更多的信息。问题是，如何选择合适的分布。
回到本章开始时提到的VAR值为1,520万美元的例子中，我们现在可以评估这一数字的准确性。使用以正态分布为基础的数值法，该值的标准误差为万美元。因此，围绕VAR估值的双标准误差置信区段为[1,380万美元，1,660万美元]。这种窄间隔应该表明了VAR估值还是很有说服力的。
以上摘自《风险价值VAR》.中信出版社. 2010. 【美】菲利普·乔瑞（Philippe Jorion）

期权匿名回答 · 2023-2-11 02:55:42

楼上的回答偏重于统计的角度，将VaR看作一个统计量对其估计值进行分析，并且在正态分布的假设框架下进行分析。实际业务中金融机构和监管部门关心更多的是VaR对于风险的把控和预测能力。因此最常用的检测方法是backtesting, 即将模型计算出的VaR在一定的时间窗口内与真实的P&L进行比较，记录P&L超过VaR的次数。正态分布下这一次数应该在3附近，如果超过3则说明VaR模型不够保守(低估风险), 需要进行调整，如乘上一个大于1的惩罚因子。
如果需要估计VaR的置信区间，对于非正态分布的P&L, 可以用Monte Carlo 放回抽样的方式生成多个复制，对每个复制分别进行VaR的估算，也就是生成一个VaR 的抽样分布，即拔靴(bootstrapping)方法。此法是一种非参数统计法，不受正态分布假设的局限。

如何衡量风险价值VAR的精度？

2 个回复