主动、高频与科技化的量化策略——第十二届金融创新服务论坛之量化投资圆桌论坛

论坛 期权论坛 期权     
爱期权   2019-12-19 21:16   3442   0
主动、高频与科技化的量化策略
——第十二届金融创新服务论坛
之量化投资圆桌论坛
主持人:刘方 中信证券首席组合配置分析师

圆桌嘉宾:
王  伟  凯丰投资量化投资总监
王  岩  招商基金量化投资部基金经理
曾质彬  广发基金量化投资部投资经理
宋英晖  海狮资产副总经理、投资经理




刘方(主持人):
大家好,我们很荣幸的邀请到了来自公募基金、私募基金的几位大伽,和大家一起聊聊关于量化投资的一些话题。那我先从左手边依次介绍一下各位。
首先是凯丰投资的量化投资总监王伟先生,在量化交易型策略和自上而下宏观对冲配置方面有着丰富的经验,欢迎王伟总。
第二位是招商基金量化投资部基金经理王岩先生,目前于招商基金量化投资部担任基金经理,主要从事指数增强和衍生品领域的投资管理工作,欢迎王岩总。
第三位是广发基金量化投资部投资经理曾质彬先生,曾质彬先生专注于多因子、指数增强、量化对冲策略的研发,在机器学习在量化投资领域的应用上有着较多的经验,欢迎曾总。
最后一位是海狮资产的副总经理、投资经理宋英晖先生,对于对冲基金风险管理体系有着非常深刻的认识。宋总目前在海狮资产担任副总经理和投资经理,主要负责场内期权策略的研究、开发、交易,管理多个私募产品,欢迎宋总。

今天的话题,叫做主动、高频与科技化的量化策略,这个题目比较大。首先我们请四位嘉宾分别介绍一下目前管理的策略和产品的大概情况。首先从王伟总开始。

王伟(凯丰投资):
我们跟大多数人一样,主要集中在市场中性类策略指数增强策略两大类。未来期权工具出来后,如果成本合适,可能还会做一些新的结构出来。其实我们的策略偏基本面一些、偏低频一些,跟私募里面比较多的高频策略不太一样,基本上就是这样的情况,谢谢。

王岩(招商基金):
招商基金量化投资主要的投研领域和产品布局以指数增强为主,这也是公募基金在量化领域里面比较成熟的模式,也是我们的业务大头,沪深300、中证500、中证1000都是我们主要的布局方向。像衍生品、期权我们参与的也比较早,更多在于专户层面,是策略的补充,以丰富产品线提供给客户多维选择。明年我们的重点布局方向,应该是在指数增强的特异化、潜在的衍生品公募化上做探索,一会儿再分享我们这个领域的一些想法。

曾质彬(广发基金):
广发基金量化投资部的产品主要包括量化对冲、指数增强和风格化的量化多头产品,在风格上布局也比较全面。专户层面上主要是绝对收益型产品、以及客户定制的一些产品,策略方面,根据产品类型的不同也涵盖传统的多因子选股、指数增强、事件策略、以及一些中低频的量价类型策略。我这边主要是基本面的指数增强模型和量价策略比较多。

宋英晖(海狮资产)
我们海狮资产对期权有长期、深入的研究。2015年市场下跌发生后,我们看到股指期货有一个贴水,然后用股指期权复制空头可以拿到25%以上年化收益,而且这个收益持续存在。在2015年下半年我们对期权进行大范围布局和深入研究,我们当时讨论的是,25%的年化收益是不可能持续的,我们一定要深入地对期权定价,还有波动率,进行更深入的研究。一直到现在,我们海狮都坚持在期权这个领域。目前,我们核心的几个策略:一个是无风险套利,就是股指期货、期权、ETF三者之间的无风险平价套利,因为三者底层资产都是上证50,但是参与者不一样。所以,我们通过量化模型监控三者的价格关系,如果打破了这个价格平衡,我们就进场套利。另外,我们还有交易波动率的策略,波动率我们从几个维度进行分析,包括研究历史波动率的走势,还有历史波动率锥,和它的分位点,用隐含波动率进行比较,隐含波动率自身也进行比较,然后我们有一个做多或者做空波动率的想法。最后我们对隐含波动率微笑、斜率进行研究,然后交易波动率。最后,我们还有一个核心策略,波动率曲面套利,我们有自己的期权定价模型,利用这个模型和市场的价格进行比较,高卖低买。所以,我们发展到现在,在期权这个细分领域还是有一定的经验。

刘方(主持人):
谢谢宋总,今年量化策略还是属于热度比较高的一个话题。我们想分别请王伟总、曾总,从公募、私募角度聊一聊。下半年有一些量化私募出现一些回撤,不像上半年预期这么高,今年股票量化策略的一些情况,您怎么看的?

王伟(凯丰投资):



今年的量化策略,上半年、下半年可以说是冰火两重天,有很大的变化。去年从7月份开始,有很多的交易型高频的量化基金可能净值走平了很长时间,包括一些很出名的公司。今年上半年后,因为有一轮比较火爆的成交量,叠加比较高的波动率,这些高频交易策略有一轮很显著的复苏,很多在二、三月的时候赚了百分之十几的收益。下半年,从5月份开始,大量的交易型策略的收益发生比较显著的萎缩,很多可能跟IC贴水差不多,每个月维持几十个基点,收益勉强能够覆盖贴水成本。但这实际上不是量化的全貌,因为市场上进化到现在,就像市场也有说量化投资的 1.0、2.0、3.0的版本,甚至有人说已经到了4.0版本。其实这并不是一个像1G、2G、3G、4G的概念,5G一定比4G好,速度和容量都要好;但策略并没有高低之分,每一个策略有非常明确的优缺点,特别对于交易型策略而言。
我们看一下主要依赖什么赚钱?现在交易型策略普遍逐渐风格化,收益逐渐有着Beta一样的特性,其非常依赖于高价股的流动性、高价股的波动率、或者市场出现题材的频率。如果市场风格发生剧烈变化,无论是AI还是高频交易策略一定会出现回撤,而且是集体性的。无论从外部表现还是精细化归因,都会发现这类策略呈现几个特点。虽然它背后的原因五花八门,有的方法论是深度学习,有的方法论是很复杂的高频多因子,确实也捕捉了很多量价上的规律,但是呈现出来的特点,如果以归因来说,30%-40%的程度上,可能跟高价股的流动性和波动率有关系。因为事后去看,集体回撤往往发生在事后。
我原来在公募,公募比较普遍地用选股获取超额收益,在私募并不算比较普遍的做法。这种做法其实超额收益更稳定一些,总体来说,今年上半年可能12%的超额收益左右,下半年9%左右,均匀性可以得到很好的保障,换手率大幅度低于交易型策略。偏基本面的多因子模型,以中证500增强来看,今年能够有二十几个点超额收益,每个月超额收益也是正的,跟市场波动率流动性关系不大,这个角度来看,也并没有看出来有什么不一样的地方,这是我想讲的一个内容。
但是根源是什么?就是最终发生这个事件根源是什么?因为我们局部领域整个策略有比较显著的拥挤。这个拥挤体现在几方面,很多的因子(特别技术因子)如果用开盘价成交,还能获得一些超额收益。但如果用均价、或者几个小时的平均价交易,便会获得负的超额收益。因为如果策略太拥挤,可能导致股价出现不可预料的变化,这是策略拥挤的非常好的一个实证证据。
另外,无论用什么方法论,只要是高换手策略,无论AI还是高频量价因子、还是其他新的方法论,大家回撤时点几乎完全一致。可以精确到交易日,基本周五到周一,或者周五到周二,回撤有的大、有的小,这和每个管理人风险管理的诉求和稳健性不太一样。所以这个行业从相当程度来讲,收益的获取是以流动性为基础的,所以被迫持有很多高价的流动性股票,底仓的波动呈现出来这种特点,当交易的收益无法覆盖底仓的波动,或者交易的收益变得非常稀薄的时候,这一类策略逐渐的Beta化,大家就会看到这类策略会有剧烈的波动,有低潮、高潮期。当然高潮期的平均值会显著低于历史峰值,这是今年发生的比较显著的变化。我们去年在讨论这个事情的时候,没有想到会来得这么快,因为今年下半年,私募在高频上,或者其他领域叠加起来,整个扩张可能上了1500亿的规模。这对于市场来说,的确是压力比较大,而且下半年尽管在局部领域,比如像电子股、医药股有一些过热的迹象,有利于这些策略发挥,但是没有出现去年那么大规模的波动率的提升,所以这类策略跟市场流动性更加相关。
我就先说这么多,谢谢。

曾质彬(广发基金):



王伟总从私募和量化的运行环境来说,对量化策略表现做了一个很详细的介绍。我这边主要是从公募的角度,看一看量化策略今年在公募上的一些情况。今年对于主动权益来说,是一个丰收大年,因为经过2018年这种持续下行探底行情之后。今年很多的主动权益表现都非常好,像我们广发基金的主动权益产品,大多都是30%-40%以上的收益。但是对于量化来说,特别是对于公募来说,今年的超额收益并不是很容易做。我们来看一个数据,限制较为严格的指数增强产品中,300增强的超额收益中位数大概3-4个点,500增强的超额中位数大概5-6个点。而且这里面还包含了什么?例如300增强,分红已经占3个点,还包含科创板打新的收益。如果把这些收益都去除掉,对于公募来说,指数增强产品的超额收益基本上很少或者没有。就是从中位数角度来看,这一点跟在座很多做私募的同行,动不动就是十个点、二十个点、三十个点的超额收益来说差异很大。在主动量化这一块,收益中位数大概27-28个点,也是跑输宽基指数的。像我们团队300增强的超额收益是10个点,主动量化这一块是40-50个点,中性的产品13个点,这已经是公募市场上比较靠前的水平了,当然这跟公募整体的交易系统和交易机制有关。
整体来说,今年对于量化来说,特别是公募量化来说,超额收益比较难做的。这里面的原因,第一个是因为公募环境可能比较关注于一些基本面因子,包括资方也有一些要求,可能在长期的风格暴露上有一些要求。2018年的行情下,大家会延续配置估值、红利这类比较偏防御型的因子,但今年这些因子的回撤非常厉害。还有一个原因,今年的行情机构抱团现象非常明显,今年表现非常好的一些行业,比如食品饮料、电子、家电、猪肉股,这几个行业涨得非常好,如果策略没有在这些行业上做很多的超配,其实表现会比较差强人意。这种抱团现象,对于量化来说,也是一个不太友好的环境。

刘方(主持人):
我想追问曾总一个问题,刚才您提到我们也可以看到一些公开数据,广发今年公募指数增强里面,超额收益在300增强里是第一的,即使扣除打新因素,收益也是比较靠前的。我不知道咱们的多因子或者指数增强量化框架,您觉得和市场上其他的指数增强来看,有哪方面的一些差异?或者优势所在?

曾质彬(广发基金):
今年我们这边做得比较好的一点,其中刚刚提到一个原因。今年公募指数增强的回撤可能因为各家在估值和红利这一块暴露较多。因为2018年的行情,大家都有一种动量思维,也会延续这样的配置,所以在估值、红利风格上暴露比较大。但是我们团队比较注重回撤的控制,所以风格上会做得比较均衡一点。我们关注的是超额收益的回撤情况,拿我们的产品表现来看,我们超额收益是比较稳定的状态,不一定每一期我们排在第一、第二的位置。但是我们每一个月都可以保证我们排在前1/2,所以长期来看,这样的效果很明显的。因为我们很关注回撤,对回撤控制做得比较好,具体方式是在红利、估值因子上,我们的暴露是比较均衡的。今年表现好的是成长、分析师、陆股通因子,2018年大家不太会在成长风格做暴露,我们每一个暴露比较均衡,如果我们今年成长暴露非常大,可能我们产品收益会更高,因为我们做得比较均衡的配置,所以在风险和收益上,会取得比较好的一个效果。

刘方(主持人):
谢谢曾总。下一个话题,就是300股指/ETF期权,300期权其实现在都紧锣密鼓的筹备期。我们请王岩总和宋总,从公募基金、私募基金展望一下,300期权上市后,会对策略、产品形式,还是产品的收益结构,风险收益预期方面,会有怎样的一些新的影响或者是考虑呢?

王岩(招商基金):



我谈一谈从我们招商基金的视角怎么看待期权的问题。首先一个大的认知是沪深300期权的规模和可以容纳的资金以及相应可以做出的策略一定比上证50更丰富,一是因为受众,二是背后标的确实可以容纳更多的策略。最简单的逻辑是,上证50指数增强用期权的作用不是很大,因为上证50是比较难做增强的指数。但沪深300增强是比较成熟的一套交易策略,就像刚才广发的同行介绍了今年做到10个点超额收益,这是比较难的。历史上公募沪深300增强的产品平均每年只有3%左右的超额收益。期权可以起什么作用?首先是可以降低沪深300增强策略本身的相关性,这个怎么理解?从我们提供产品的角度来看,怎么让本身有意配置沪深300的资金不单单依赖于一个资产?在产品创新上,有没有可能通过期权引入降低沪深300增强策略和其他沪深300增强的相关性?手段可以有两种:一种沪深300增强指数化,以备兑开仓为例,它可以显著控制指数本身Beta回撤,无论从标普500、上证50的回测情况来看,这都是现实解决方案。他可以很显著的将指数与沪深300增强的超额收益相关性控制在0.4左右的情况下,很大程度上减少两个资产组合的回撤,而且很简单。另一个方法,本身沪深300增强策略里有没有可能引入期权,使得我们可以在策略端把回撤控制下来,进一步使得策略本身和其他的沪深300增强或者中证500增强相关性降低,这也是一个讨论的方向。当然公募有一个很大的瓶颈,在于公募基金参与期权有很多约束,但现在我们从2019年很多公告看出来,可以看到这是在逐渐放松的。所以我们想招商基金明年的努力方向,也是在这个领域里面,看能否提供这样的对应产品给我们一般投资者、机构投资者,因为这很大程度上降低了期权的参与门槛,对于很多不了解期权的投资者参与起来比较难,这是指数增强领域我们的一些想法。
回到期权本身,像刚才宋总介绍,期权的波动率套利、曲面套利,期货、期权、现货三者之间也有相对确定的套利交易机会。包括沪深300和上证50的标的是高度重合的,它们相关性和波动率相关性也有潜在交易机会存在的。在沪深300期权真正上市后,可以从这两方面提供策略。
2016年一篇论文讨论美国市场公募基金如何使用期权,它的样本里面有170多个主要的公募基金。在使用期权后,收益统计上有显著的高于其他未使用期权的同样基准的公募基金。简单来说,使用期权公募基金比不使用期权的公募基金收益更高。我希望以后衍生品越来越多,我们同行一起携手,把这个产品线更丰富,把更好的产品提供给我们的客户。这是我们这边的一个看法。

刘方(主持人):
我想请教王岩总,您刚刚提到海外的包含期权的公募基金里面,普遍采用对冲这些比较多。您觉得从期权公募基金视角来看,国内的投资者和市场而言什么样的策略更适用一些?可以分享一下吗?

王岩(招商基金):
从海外来看,首先期权的工具化是一个大的方向,我们可以看到,衣领、备兑等策略在标普500都有对应指数开发出来。在2010年的时候标普500备兑指数是美国交易所重点推的指数,也发行了很多ETF,拿到同样Beta情况下,产品风险收益结构得到改善。美国收益市场实盘业绩得到认可。我能想到第一我们A股市场做的事情就是工具化上面先做出一个尝试。
第二个领域是除了工具化产品本身以外,还有就是期权本身策略产品化,同样我还是回到之前的观点,虽然公募基金很多这方面的约束,但是因为期权肯定参与门槛对机构投资者来说逐渐降低,无论限仓比例还是可以参与的资金,所以我们后面开发的策略,更多是基于期权波动率,在绝对收益领域上,去拓展我们的产品线。我们本身是计划在2020年尝试布局一只期权、期货为交易工具的公募产品,由波动率、升贴水、股票本身的权益波动作为资产组合,形成追求年化绝对收益7%,回撤控制1.5%-2%的产品,成为固定收益资产替代,也成为理财产品替代。近些年理财收益逐渐降低,相对提供更高回报的资产在市场比较匮乏,这是我们公募领域可以重点发展的一个方向。

宋英晖(海狮资产):


我觉得会丰富一个投资标的,过去我们投资标的还是比较丰富的,有股票、期货、基金、债券等。但是这些标的都是线性品种,线性就是看对了就赚钱,看错了就亏钱。而期权是非线性品种,什么叫非线性?如果大家做期权就知道,有可能看错市场依然可以赚钱,期权品种增加,可以更加丰富我们投资标的。
二是在风险管理上的影响,传统来说,要控制仓位风险,可能做的就是减仓。但是减仓的成本比较高,如果不减仓用股指期货对冲,资金占用比较大。尤其是目前股灾后,股指期货处于贴水状态,股指期货对冲风险还是比较高。而期权对于组合风险的控制,买认沽再卖一个认购即可,期权是很重要的一个风险管理工具。
三是有效提高市场效率,股指期货现在贴水很严重,期权的引入、特别是沪深300指数期权的引入有一个平价公式,这样有可能倒逼市场股指期货贴水有所收敛,这样,如果股指期货贴水收敛,有可能降低我们量化其他策略的对冲成本。
四是期权是另类资产重要的配置,我们看了一些资料,还有刚刚王岩总提到,美国从2002年提出了Buy Write指数,到目前已经有20个期权策略指数。从相关性来看,2005年到2018年期权波动率策略回报年化8%,回撤4.8%;同期标普500年化5.2%,回撤是52%,相关性只有0.2。期权与传统策略的相关性最大的也不超过0.43,所以期权策略、引入,对于私募或者公募角度,是很好的另类资产配置的工具。在策略方面,我看到国外的一些策略,做空标普vix期货,做多欧洲50VIX期货,赚取两个市场的carry。虽然国内没有波动率期货,但我们可以分析一下50VIX和300VIX的相关性,两者虽然不一样,沪深300覆盖的行业更多,上证50更加偏大盘,但是情绪趋同,所以只要两者差别拉大,就可以利用期权策略捕捉这个机会。
包括我们可以分析两个跨品种的套利,两个品种波动率结构的变化,比如说微笑的程度,一个微笑特别厉害,另一个没有怎么微笑,是不是我们也可以做套利?还有一块,我们可以做同一品种下多市场套利。因为以前上证50只有单纯三角套利,沪深300引入,除了单纯三角套利,还可以比较深市300ETF和股指期权,或者沪市ETF期权和深市ETF期权,多市场错配机率,这对套利空间就有比较大的提升机会。目前,我们就在积极的建模,完善系统,捕捉这一块的机会。

刘方(主持人):
谢谢宋总,不管做股票的策略还是期权衍生品策略,大家现在一提到量化策略,可能都离不开几个词,一个机器学习、数据挖掘、人工智能,这些关键词在我们策略中怎么应用,应用到什么程度,影响怎样,各位大伽怎么理解的?

宋英晖(海狮资产):
人工智能在各个领域应用比较广泛的,特别在金融领域。比如机器学习用于因子挖掘,神经网络用于高频交易。目前我认为人工智能在金融领域的应用还是有一些瓶颈的。最近我看了一些文章,张博教授的文章,说得挺对的,如果人工智能要完全得到应用,必须有几个条件的满足:一是信息足够充足,包含全方位的信息;二是这个东西一定是确定性的,不确定不行;三是静态的。但是我们看一下金融市场不可能是确定的,也不可能静态的,像中美贸易摩擦的不确定性,如果人工智能应用金融领域特别是策略还是有瓶颈。但是我们会花很多时间突破,就像我们期权衍生品领域,有使用AI算法估算期权曲面、定价。我们未来也会朝着这个方向路线、突破这个瓶颈。

曾质彬(广发基金):
我简单讲一下个人的浅见。人工智能、机器学习目前发展比较好、表现比较优异的领域主要是图像、语音识别这一块,文本表现这一块比前面两个都要稍微弱一点。其中有一个很重要的原因,机器学习表现优异领域特征,信息边界很确定,判断和反馈有一个明确可量化的标准,金融市场是一个很开放的问题,这里面涉及到特征非常多,每一个特征解析力非常弱,这就导致了很多人工智能算法,在投资上表现并不是那么智能。
其实在投资任务里面,人工智能在这里面的应用,我感觉应该有两个主要障碍,一个是信息边界问题,因为像在投资里面,它是一个很开放性问题,它涉及到的状态非常多,而机器学习本质上并不能真正“理解”任务是什么,只是会在历史数据里面寻找拟合函数拟合历史,这只是它的一个功能,本质上并不能像人一样理解这是什么,本质上只是在数据高维空间上做模式识别,只是去寻找一个最优化的拟合函数拟合历史数据。恰恰在投资这一项任务里面,它的特征非常多,每一个特征解析力非常弱,机器学习这种特别依赖数据的学习方式造成的后果就是它无法很好地分辨我们喂给它的哪些是信息哪些是噪音,而恰好,投资领域是信噪比很低的环境,所以会面临很多问题,我们自己的研究发现,特征工程,基本上决定了AI模型的表现,就是人工特征提取,特征工程变得非常重要。
第二个障碍,就是没有一个可以判断或者是明确反馈的标准,意思是像现在很多的机器学习应用比较好的领域,都有一个非常明确判断和反馈标准,但是在投资里面学习目标是什么?学习的目标是提高投资能力,但是投资能力这一个东西,用什么衡量?现在没有很好的指标度量什么叫投资能力,只能退而求其次找一些代理变量,可能就是历史数据信息比率,或者过去一些收益率,作为投资、机器学习进化目标,但是这只是代理变量。因为通过AI模型去寻找去拟合的只是找到一个,在过去历史数据里面,信息比率非常高的一个模型,但并不代表是投资能力很强的模型,因为拟合出来的模型,可能只是一个在历史上信息比率很高的模型,但是泛化能力很差,导致样本外表现很困难。
一个是信息边界的问题,一个是明确的判断和反馈标准的问题,优化目标是什么的问题,上述两个问题,主要是低频领域里面有一些障碍。如果是比较偏高频的方向上,可能效果不太一样,因为对于证券市场来说,低频环境下市场随机性较大,而高频环境下市场的反应只与少数信息有关,其他大多数影响因素在超短时间内是不会改变的,或者说改变了并没有那么及时地反映在价格上,信息含量较高,机器学习在这样的环境下会更适用。
以上就是我的理解。谢谢。

王岩(招商基金):
因为我不是机器学习方面的专家,所以不敢下一些决定性结论。我想从两方面谈这个问题,一是我们团队对机器学习中比较认可的模式做的一些尝试,并且看到了效果;第二是我们听说同行正在做的可行的一些方法,我们也正在尝试中。
对于第一个方面,我们目前已经做了一些机器学习方面的工作,并且看到了效果。我先介绍一下我们研究的思路,对于机器学习、神经网络以及其他的各种算法,我们更多地是把它们作为一个分类器使用,通过这个分类器我得到的结果是能把股票组合分为“好的股票”和“差的股票”,既分组表现要单调,特点要鲜明。想要得到这样的结果有一个前提条件,就是数据样本在某一个领域、某一个方面、某一个特征必须鲜明,这样才能作为分类的基础。如果只是拿一堆模糊数据盲目使用某一套算法还指望得到一个好的结果,这样的做法是缘木求鱼,只追求算法来解决本身模糊的问题,我认为这是不理智的。我们做的事情有一些在低频领域上的因子也好,或者说一些数据特征,本身天然是具有鲜明特点的,举一个例子,曾经大家抛弃一些因子,像异质波动率,现在把它当成一种风格来控制,没有人当成单纯的Alpha用,这个因子本身特点是鲜明的,可以通过机器学习或者神经网络算法,把它作为一个分类器用,我们发现这个因子并不是没有价值,因为本身的特点依然鲜明,可以帮我们做区分工作。在这个基础上,我们可以进一步的挖二次数据变化,包括机器学习处理过的异质波动率之后的股票特点。通过这个分类器处理之后,再对样本进行重新二次加工,最后的效果比原来单纯使用因子要好一些,这是我使用机器学习的第一个感悟。
第二个感悟,从公募基金同行开始关注德银的《机器崛起》相关报告开始,到后来业内也有发表相应论文,其实大家都忽略了一个问题,就是我们过度依赖算法,认为算法可以解决很多问题,而忽略自己该处理算法以外的问题,比如说样本如何选择、样本区间如何设定等。在德银以及本土化的一些报告里面,通常把过去6个月、12个月作为一个样本区间,然后把这些数据放到算法里面计算,就觉得是解决问题了。其实这样的思路是不对的,因为在金融市场存在不确定性,就像刚才几位同行提到的信噪比就是一个问题,在这样一个复杂环境里面,我们的样本不应该只单纯考虑6个月、12个月或36个月,样本的选择更多应该依据算法、数据特点的变化而变化。而具体怎样变、哪一段样本可以真正做分类,这才是算法成功与否的一大关键。我们的机器学习算法里面,对于预处理样本的选择实际上就占了整个算法50%的工作量。后面还有30%的工作量是数据再次处理,我们主要依赖神经网络,而其他机器学习算法使用的不太多,占比不到20%。比如我们做中证500指数增强,对于低频交易来说,年化收益20个点左右,回撤大概4个点多,从增强效果看虽然不是特别突出,但表现相对比较稳定,目前我们也比较依赖这套算法,这也是我们认为对于中证500比较可行并且最后效果还可以的算法。
第二个方面,有些算法我们听说可行,但是没有完全尝试成功,这些算法可能私募做得比较多,也是我们想学习的。我们业内常说的“四大金刚”,业绩非常好,传说业绩中有T+0策略的贡献,也有神经网络算法贡献。我们找同行和朋友打听后得到一些细节,但不是很明晰,我们整理总结的感觉是,神经网络,机器学习里面的经典算法也好,把这些算法用在高频数据上,进行无监督学习,可能是可行的一个方向。同时除了数据处理,在策略的合成上,也是一个应用的方向,就比如在海量的数据里面如何进行新的组合、搭配,甚至是对于参数的探讨,都是机器学习在高频领域发展的方向。我们在这个领域也刚尝试不久,做了半年左右,从回撤结果来看,机器学习对组合信息比的提高和绝对收益的提高上有所帮助。以上是我对于这个领域的一点看法。

王伟(凯丰投资):
有两件事情可确定,一个是价格某一部分的可预期性是存在的,稳定度表现出来产品形式肯定上到2,超额收益的信息比率可以上到5-6,这是可以确定的,否则不会有这么多人作出这些收益。第二,这个规律是变化的,有的时候是渐渐变化,投资人要做的就是找到规律,找到尽可能不再变化的规律。或者说虽然变化了,但可以很大程度上识别它,机器学习就是这样一个工具,这个工具使用要非常小心,我们看到股票的历史,金融市场价格的序列,从随机分析的角度说,通常是一个轨道、一条线,如果你是上帝,可以让世界重复很多次,才可以发现这个规律,而实际中只发生一次。所以很重要的是,我们首先要分析过去十几年的股票行情历史,要确定其中哪些东西大概率是随机波动的,哪些东西大概率是重复出现的,然后把随机波动的部分去掉,剩下部分再拿去用机器学习的一些模型,如决策树、神经网络等复杂的算法,去找出肉眼很难直观识别的规律。在做的过程中有很多方法,这也是创新度最高的地方,首先第一点,可以类比算法传统的应用领域,比如说刚才提到的语音识别、图象识别或者视频,这些都是比较成熟的领域。那么这些应用领域有什么特征呢?特征是当这个图像的全部像素被看到后,就可以唯一客观地决定这个物体究竟是什么东西。而金融中在高频领域也具有这样的特点,既在微观上,尽管决定股票价格的因素千千万万,比如列一个函数,可能有几亿个变量,但是在一分钟这种很短的时间内这些变量的变化是非常微弱的,平均来看可以认为变化不大,那么就可以依赖这些微观信息来预测股票未来的价格轨迹,就像图像的像素一样可以唯一确定股票价格图像,如果交易的基础设施性能好的话还可以抢先下单。
另一个方面,如果往更低频领域走,换手率上不去,预测时间要拉长,原来预测5秒、30秒、1分钟,现在变成5个交易日、一个月,这个时候影响股价变化的维度就多了,随机波动也变多了,这时候就要像刚才这位同行指出的,需要把股票价格进行分解。其中有一些东西是随机的,更多依赖于基金经理本人对市场的理解,这部分无法预测,也是花多少金钱、多少精力都不可复现的。另一部分则有一定规律,我们就可以把数据拿出来,用网络算法跑,可以跑出来一些值得学习或者对于认识市场有帮助的结果。因为直观来看,人的大脑分析能力很多局限于线性领域,非常擅长发现因果关系,进行逻辑推导,但是不太会发现数据里面隐藏的东西,尽管有的时候大家觉得这个东西无厘头、没有规律,甚至实际看上去很绕的逻辑,但是这个逻辑在市场是真实存在的。所以我们在分析的时候要特别小心,否则也很难成功。
市场上AI做得好的不少,但是收益非常有特点,基本都是2017年和今年收益不太好,而2018年收益特别好。在低频领域,大家都说2017年AI投资呈现出了“19现象”,今年也差不多,这与2017年股票横截面的结构上发生突变,产生了跟历史上不太一样的结构行情有关。2018年之后,大家适应了这种变化,2018年结构没有发生剧变,一季度中1月是避险行情,爆雷股跌得非常惨,二三季度开始业绩爆雷股疯狂上涨,高潮发生在次新股的全部涨停,这时候呈现出的市场特征跟2018年1月的行情完全不一样。2018年的这个行情结构在今年3月份表现的没有那么强烈,但是在延续,并且持续往平衡在发展。今年4月份后,由于政治局会议公布的一些经济数据表现不太好,大家的热情被浇灭了,4月份开始发生价值回复。5、6、7月份后,市场极端避险情绪升高,伴随着中美之间的又一轮加税风波,贵金属涨了一波、国债涨了一波。最后大家看到市场情况没有想象的那么糟,而且二季报数据特别是科技股表现也很好,然后大家就开始疯狂炒科技概念,一直磕磕绊绊到现在。所以至少从我的角度来说,近期的市场结构变化特别剧烈,这种变化是AI很难适应的,因为很多人做AI的时候只是简单用过去几年数据算出一个平均的东西来指导投资,这个平均的结果对于有些月份比较有效,但有些月份表现很差。如果把数据频率放低,根据我问过的很多人反馈,今年一些做AI投资的大概率做得不是特别好。所以我最早的时候说过,大家把AI分为1.0、2.0、3.0、4.0,但这些概念更多的是一个噱头,就像大数据出来后,大家发一波大数据基金,AI出来后,发一波AI基金,最后大家发现,这些基金的收益里面很大程度上Beta成分居多,真正有含金量的地方,也许只有个别的基金管理人才能挖掘出来。所以从广义的角度来看,目前的AI更多的是有一个销售意义,而它真正的使用价值挺难掌握的。谢谢。

刘方(主持人):
我追问王伟总一个问题,您觉得凯丰量化策略和市场上其他流派的量化策略,核心的差异和优势或者说您觉得定位是什么?

王伟(凯丰投资):
我们可能被市场划分成量化策略1.0,每个人想法不一样,我的想法是一定要找市场最不看好的领域去做。因为那个领域最不拥挤,所以我们的超额收益相对来讲还比较稳定。那么我们每年的超额收益差异小到什么程度?在比较低的换手率前提下,比如我们的双边换手率在30倍左右,相比于中证500的超额收益率,2017年是21%,2018年是19.6%,今年是21%,你会发现每年超额收益率的差距几乎没有超过一个百分点,这是我们策略的第一个特点。
第二个特点,每个月的超额收益都是正的。我会找市场每一个领域最不受大家关注的来做,因为最受大家关注的地方,一定会迅速地爆发成一个非常火热的战场,迅速地Beta化,有很强的周期性,这对大类资产配置的管理人来说,也许是一个好消息,因为这样可以轮着来,但是我并不是去抢这一块,我觉得投资永远站市场对立面,才可以赚一点钱。因为Alpha本身是一个零和游戏
第三个特点,这样做组合的流动性非常好,你抓的股票是别人不要的,你对手盘是整个市场,哪怕你占市场70%-80%成交量,也无法撼动价格。我做过实验,一些很小的股票,我占80%市场成交量。但是整个股价纹丝不动,基本上从开盘到收盘在一个价位上,当然我交易比较慢,因为没有人跟你抢。而一些很性感的股票,比如茅台拉它两个点试试,受利好刺激,资金蜂拥进去,但跌的时候也特别狠。
从我的角度来看,纯粹这样的逆向,更符合我长期稳健的期望,我不太追求一两个月超额爆发,我追求比较均匀的节奏。因为投资是面向未来的,这样也才能有信心在未来能持续。而且我们投资是静态的,因为我们策略中的因子权重是靠人的经验拍出来的,完全不进行调整,所以说我们的量化策略很落后,可以说是市场中的1.0版本。
继续回到流动性的话题,买的时候冲击很小,因为没有人跟你抢着买,如果这个股票买对了,那么卖的时候就会有很多人做你对手盘抢你的股票,这时候又不缺买盘了。这样的股票投资成功率就比较高,就像逆向投资,涨上去后很多人会追这个股票,这个时候整个市场又站了你的对立面,所以流动性就又很充裕了。从规模、稳定性角度来说,我们的这类策略可能寿命会更长一点。就像有的人问巴非特,你的投资有什么策略,有什么特点,有什么经验?他的回答中我印象最深刻的有两条,第一条就是一定要有耐心,很多人没有这个耐心;第二是每年单独来看不怎么管用的策略,长期来看才是管用的

刘方(主持人):
谢谢王伟总,分析非常精彩。最后一个话题,正好现在年底了,那我们就对未来一到两年做一个展望,首先就是对于现在的量化团队,在重点研究布局的策略方向是什么?二是如果从一年时间来看,咱们比较看好的策略类型,或者说哪一个策略点,未来表现会相对比较好,每一位嘉宾2分钟时间,简单分享一下。

王伟(凯丰投资):
我们的策略比较集中在偏基本面领域,最大原因主要是我们不擅长做交易,因为交易这个东西其实有很强的装备竞赛性质,很多做高频非常好的团队,每年在硬件或硬件相关人员上花费高达两千万以上,我估计我们老板不会答应这件事情,所以目前我们没有这方面想法。我们主要集中挖掘市场上比较有逻辑的一些基本面的东西,然后我们会接受比较低的一个超额收益,不过目前来看,这类超额收益的空间还比较可观,因为经过两年的行情爆发后,大家对明年的预期下调非常多。同时我们也会丰富策略类型,比如国内比较主流的多元化期货交易,还有股票alpha,我们都会做,其余的策略我们就不太做了,因为我们还是比较追求策略容量的,以上就是我们策略布局上的想法。
明年的量化也许并不是那么好做,一方面有一些非常拥挤的策略领域,目前资金量非常大,以至于整个市场实际上是30%-40%的资金在套剩下部分资金投资者的利,但这个套利是很难做的,市场能赚的钱就那么多,分蛋糕的人多了,蛋糕自然少了。波动性越来越大,策略表现越来越像Beta,如果这种局面一旦发生,考虑到市场是动态的,对于资方来说,有两个反应:一是大量撤资出现,大家都在熬,谁最先熬不住了就退出,等部分资金退出后策略收益会恢复一点,所以最终会达成均衡,也就是大家正好可以接受的水平,而这个收益水平可能和其他策略差不多,会让你觉得很鸡肋。第二点是大量的量化团队会被包养,这在江浙一带已经发生了,小的初创团队被大的团队包养,资方买不到东西,出现资产荒。比方说五人一个团队租一个别墅,出10亿、20亿做自营,慢慢变成了自营盘,导致相关策略产品的市场供应慢慢消失。但产品消失后并不是这个量化策略不存在了,而是不在供应方存在了,这也是资产荒的另外一个表现形式。所以如果从资方角度来说,这可能是明年很难受的一件事情,使得部分资金被迫选择一些另类的产品。但是对这类产品的需求量还是会很大,加上理财公司的崛起,会带来大量固定收益需求,整体来说,整个理财市场、基金市场对于这一类固收产品的预期收益率,会发生下降。大家也许以后觉得6个百分点、2个百分点回撤这是很好的收益,很容易募集,整个市场均衡水平可能往这个方向发展,过去的已经过去了,就像期货市场高频,最辉煌的时间过去了,股票市场的高频,最辉煌的时间过去了,这是市场长期发展的客观情况,大家也是必须接受的。2013、2014年的时候觉得股市永远涨,大妈炒股永远PK不过基金经理,那时候是一个月涨10个点,否则基金卖不出去,但是这样激烈的金融市场上,一切事情都会尘归尘,土归土,最终回归均衡,大家对未来的展望,有的时候要从理性角度分析。谢谢。

王岩(招商基金):
在对未来展望上,我先讲两件小事:我2010年的时候入行,从事这份工作时一开始做研究员,有一件事我今天都记得,那时候有一张维持大宗商品产销的表,这张表会让人有一个基本的宏观认识,当时我一个同事说美国对冲基金用卫星看游轮吃水来判断海上飘着多少原油库存,当时我听来觉得很玄幻,也对我震撼很大。这说明一个技术要打通或者说服务于另一项业务,可能跨界度很大。未来这种涉及到另类数据的策略,我觉得值得挖掘或者投入更多资源,就像中信刚才提到的另类行业数据,包括知识图谱等等,有一些是我们看不到的。我原来认识一个百度地图的一个专家,他告诉我,百度有任意时点搜索某一个位置的数据,以及搜索后是否到达,这可以延伸出来苹果手机某一个季的销量,就知道多少人这时候搜苹果专卖店,多少人真正去了,等待的时间等等,这些信息做二次处理、加工,就可以预测苹果手机的销量。这种方法用在汽车上也是一个道理,比如某个新品牌发布前,很多东西可以通过另类数据进行提前预知。
PE是一个看似简单,且看似有效,但是经常不太好用的一个指标,因为时效性上和可预测性上,其实是有很多问题的。如果大家有时候做数据做错了,比如把未来数据提前一两个月用来预测,可能会导致净值曲线飙升得让你难以想象,呈现出一个非常好的策略结果。而对另类数据的挖掘,有时候可以达到近似的效果,就想预先拿到未来数据一样,这对于投资是很有帮助的,也是我们尝试做的事情。另类数据包括信用卡数据,百度数据等等,我觉得这些方面应该在未来增加投入并且能带来收益,这就是我同行说的油轮的事情让我想到的第一件事情。
还有一篇文章,讲美国对冲基金为了交易速度能快1微秒,炸了多少洞,挖了多少山,埋了多少光缆,我没有求证真假,但我也愿意相信美国高频交易竞争到了这样白热化的地步,但这种情况离我们还比较远。可以庆幸我们市场还没有到那个程度,要不然很多量化投资人的生存状况就比较堪忧了,但是我们可以看到什么?在一个很成熟发达的市场里面,高频化是这样一个趋势,那我们就没有理由说像A股这样过度保护的市场里面,不必投入资源和时间做高频化投资。所以展望未来,A股市场高频化应该也是一个趋势,因为不仅仅看到海外这样做,也可以看到国内同行,在这方面做得很好的结果,同时大家无论是从实盘业绩、回测结果来看,高频化策略比低频化策略提供了不一样的风险收益结构,可以降低组合的波动率,提高组合收益,这也是未来的一个方向。如果不说那么远,2020年一开始的机会在哪儿?我个人觉得最近毋庸置疑的机会就是沪深300ETF及股指期权的上市。2015年上证50ETF期权上市的时候,带来了丰富的交易机会,因为当时大家对波动率预期非常高,而且做市商当时也不是很成熟。不过沪深300ETF和股指期权上市的时候肯定不可能像当年上证50ETF期权那样,但是也不否认大量投资者之前对上证50没有兴趣,没有参与,而沪深300大家都有兴趣,所以一定程度上会带来定价偏差和套利机会。另一方面,我相信90%多的人没有想明白上证50和沪深300谁的波动率高,多数人认为沪深300波动率高一点,因为相对市值小,其实上证50比沪深300波动率高,而且上证50的价格跳跃幅度比沪深300大,这意味着波动率上一定会出现套利机会。上交所、深交所分别推出一个300ETF期权,中金所推出一个沪深300股指期权,三者间就会存在平价套利机会。对于无风险套利策略,我对沪深300期权的期望套利收益在10%左右,这并不算夸张,如果收益能达到20%-30%也不意外,就像上证50ETF期权中信的套利策略指数年化收益在20%左右,和上证50ETF期权已经很成熟相比,沪深300期权可能明年会提供更多的交易机会。以上就是我们对短期和长期机会的简单看法。

曾质彬(广发基金):
展望未来一年团队方向和策略方向,因为已经年底了,我们部门已经做了这方面的布局。主要的投研方向上,我们团队会继续专注指数增强、量化对冲。具体来说,一方面是公募里面做得比较多的基于基本面数据的指数增强这一块肯定是最主要的。但是也可以看到,私募很多同行做的一些量价策略表现非常好,而作为公募基金,资方对我们要求是如果每年有5%-10%的超额收益,就已经是非常优秀的成果了,这是对我们策略最核心也是最基础的一个要求。第二个方面,虽然公募有交易系统、交易制度的限制,日内反向各种各样的限制,但是偏中高频的量价策略方向上,也有储备、研发和实盘运作,这一块能提供5%-10%超额收益的产品,我们有拳头产品,而能提供10%-15%收益区间的产品,也是值得我们作为公募,虽然存在各种各样的限制条件,但也是必须做投入的方向,是我们未来除了传统的基本面量化之外需要布局另一个核心方向。至于展望明年哪一些策略,或者哪一类产品表现更好,公募的指数基金发展很快,规模上来也很快,我们可以看到机构、散户对指数增强类产品,也是有需求的。因为对于指数基金是有需求的,如果指数增强的产品,能够长期稳定地提供一个超额收益,这样投资者的需求一定会从纯粹的配置指数转换到指数增强的一个配置,就像我们部门一个领导常说的一个比喻,买包烟送个打火机的事情,这一定是大家所喜闻乐见的。

宋英晖(海狮资产):
因为我们海狮主要是以期权波动率交易为主,对于明年的方向判断,其实我觉得还是比较难的。一直以来我们的策略比较关注的是黑天鹅事件以及如何防范黑天鹅。目前我们参考芝加哥黑天鹅指数,用基于50ETF期权的一个算法构建了一个黑天鹅指数,用于捕捉黑天鹅,明年等沪深300期权推出后,考虑到沪深300期权能够更好地反映市场,所以我会用300期权数据构建一个新的黑天鹅指数。这个黑天鹅指数是用所有交易的期权隐含波动率构建的,如果指数偏高,证明市场上有人在上保险,意味着是不是有人知道某一些事件,所以提前防范。过去几年时间,我们用基于上证50ETF期权构建的黑天鹅指数,成功捕捉了三只黑天鹅,对于我们来说,因为交易期权波动率时怕的就是跳空,所以捕捉黑天鹅很重要,虽然不一定每一次都能捕捉到,但是黑天鹅指数仍然是一个防范风险的好方法。此外,我们还可以通过期权预测黑天鹅,以及预测一些趋势性指标,主要通过认沽认购比(认沽成交额除以认购成交额),如果认沽认购比很高,说明市场恐慌避险情绪上升,而事实证明大部分时间市场是错的。通常当认沽认购比很高的时候可能意味着市场低谷接近了,如果认沽认购比很低,则市场偏乐观,但那是很危险的。我们用黑天鹅指数结合认沽认购比来判断市场大的区间方向。所以明年等沪深300期权一上市,我们就会布局这个黑天鹅指数,为我们未来的风险管理提供更加完善的一个指标。因此,让我们判断明年的看法可能比较难,但是我们会用各种指标、各种方法、各种工具帮助我们防范黑天鹅,避免很大的回撤,这是我们要做的事情。

刘方(主持人):
感谢各位,分享很干货,内容很丰厚。感谢各位坚持到现在,谢谢。


分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:2135
帖子:455
精华:1
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP