Tick 数据在技术上究竟是什么东西?

论坛 期权论坛 期权     
期权匿名问答   2022-2-13 08:46   9419   0
Tick 一般是指 Best Bid/Offer 的变化,就是 Order Book 上最优的买单和卖单发生的变化。题目中的例子,Tick 2 和 Tick 1 的不同就在于 Best Offer 的 size 变了(少了 25),所以产生了这一个 tick。
当然这个不等于说 Tick 1 和 Tick 2 之间没有别的 Order Book 的变化,它可以在除了 Best Bid/Offer 之外的地方变化,只不过这些事情在 Tick Data 上被滤掉了而已。
这种所谓的 Tick Data 其实就是一种对 Order Book Events 的 Down Sample 而已,它的前提假设是 Best Bid/Offer 是最重要的信息,以丢弃其它相对不如这个重要的信息为代价,缩减数据规模,让数据处理变的更容易。
而实际上,真正的 Limit Order Book Market 里,交易所发的原始数据是所有对 Order Book 的增、删、改+成交这四样,特别是改单一般都是占整体数据流的大部分。只不过要处理这种级别的数据,需要你懂一些数据结构的操作,能自己维护重建 Order Book。这个手艺一般做 Quant 的人都不会,要么就是写出来的代码实在太慢根本处理不了原始数据的规模,所以往往是为了简化起见就给他们 Tick Data,一般人就都能凑合着用了。
因为这种二手数据的本质,Tick Data 做的好不好当然是会有区别的。虽然说是需要记录每一个 Best Bid/Offer 的变化,但实际上这种数据反正也不用维护 Order Book 的一致性,因为各种技术问题少记了几个也不会有人说什么。甚至可能某家的数据处理程序还有 bug ,其中一些数据偷摸的错了一些,一般人也很难发现。这些都是可以用来比较数据质量的。
建议大家做 Quant 工作的,还是要注意编程基本功,有条件就自己直接处理原始数据。少一层二手过滤,就少一次出错的机会,离你发现新策略也就更近一步。
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:400157
帖子:80032
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP