非常赞同 @kyuubi 的回答, 讲到了核心内容.
在经典的hands on algo trading那本书里, 作者就提到了, 量化策略分为两种, 一种是data mining driven(数据挖掘驱动), 一种是idea driven(想法驱动), 前者的收益和稳定性往往是远不如后者的.
统计学在量化交易中, 更多的是给你一个线索, 帮你提炼出有可能有用的一些特征, 比如说你发现, 每隔三个月的某一天, 美股会大幅波动一次, 这就是一个特征, 但是你只知道这个特征是没用的, 你得去研究这个事情的本质原因是什么, 你去看了一下日历, 然后发现, 哦, 因为每三个月美联储宣布一次加息, 类似这样.
可能有一些熟悉量化的朋友就会问了, 那为啥众多量化公司都在挖各种因子呢? 那不就是统计学吗?
答案很简单, 就是市场虽然是在变化的, 但是它变化的没那么快, 也就是经常说的动量效应, 所以有时候即使你是过拟合的策略, 短期内还是能盈利的, 但是失效非常快. 这种data mining的策略一大优点就是他的研发路线很固定, 可以通过堆人力, 堆机器来推广, 一个不行我就上100个, 100个还不行我就上10000个, 各种排列组合, 哪个表现好用哪个. |