正如我们所看到的,序列 X 和 Y 之间存在非常强的相关性。然而,我们协整检验的 p 值产生了 0.7092,这意味着时间序列 X 和 Y 之间没有协整。
这种情况的另一个例子是正态分布系列和方波。
Y2 = pd.Series
plt.figure
Y2.plot()
# 相关性几乎为零
prinr(pvle))
尽管相关性非常低,但 p 值表明这些时间序列是协整的。
import fix_yaance as yf
yf.pdrde交易中的数据科学
在开始之前,我将首先定义一个函数,该函数可以使用我们已经涵盖的概念轻松找到协整对。
def fitirs(data):
n = data.shape
srmaix = np.zeros
pvl_mrix = np.ones
keys = dta.keys
for i in range(n):
for j in range:
sed = S2 - b * S1
sedplot
plt.axhline
plt.xlim
plt.legend
或者,我们可以检查两个时间序列之间的比率
rio
rao.plot
plt.axhline
plt.xlim
plt.legend
无论我们是使用价差法还是比率法,我们都可以看到我们的第一个图对 ADBE/SYMC 倾向于围绕均值移动。我们现在需要标准化这个比率,因为绝对比率可能不是分析这种趋势的最理想方式。为此,我们需要使用 z 分数。
z 分数是数据点与平均值的标准差数。更重要的是,高于或低于总体平均值的标准差的数量来自原始分数。z-score 的计算方法如下: