学习量化交易如何入门和系统学习的学习量化

论坛 期权论坛 期权     
期权匿名问答   2022-9-23 09:53   7602   0
(这篇会一直更新量化机器学习策略的团队进度和沟通的思维,有这块经验的可以留言交流讨论)
很多做量化跳不出来看,用量化思维做量化,其实是个圈圈,接触过从外汇EA的,机构里面的量化,个人的量化的,还有中科大和北大出来自己整量化的,还有一些江湖流派,用程序化来辅助人工决策广招交易员手工执行的······,这里我试着以一个做量化的手工交易者角度捋一捋(偏机器学习类)。
我们先总结一下目前量化的市况:
首先,量化目前为止,高频策略最有效,西蒙斯的大奖章也是高频,出现的一些某阶段的神级战绩一样是高频,比如2015年俄罗斯伊顿在A股股指期货半年时间500万爆赚20亿,近两年可转债的团队。高频几乎都是动量和盘口,拼的是设备和速度,盘口的识别和计算,华尔街有些公司为了那几千分之一秒速度可以砸近亿美刀的情况很正常。
其次,人工交易的成功比量化要高,人工识别一些线性图形等非标准的东西更快速,机会选择上,比量化的取舍模糊但正确,盈利反而更具有确定性,且调整策略因子具有前置性,特别是基本面财务数据等因子,资金流量动向等类型的,量化是出现不对劲的数据后去做优化和调整,和技术指标一样具有滞后性。
再者,通过和伙伴做机器学习量化的沟通,看得出量化的思路和人工交易的思维方式有很大区别。这两者的思路思维逻辑顺序几乎是逆向的,量化直接以数据归纳得出模型,然后跑动策略,人工是以模型去求证数据,对了才下一步。怎么样在中间平衡,取舍二者的优劣势达到完美的结合才是关键。

好了,现在才开始。
一,端正理念误区
1,成功量化一个策略可以一劳永逸。这个是最大的误区,没有什么策略是一劳永逸的,连人工的都一样,每一个策略都在不断的剪枝优化,不断的加入不同印证维度的因子。有时候跟朋友探讨,有些量化策略,可能跑1年都是净值在1以下,但碰到策略适应的环境,收益很高,但这种环境判断,需要人工筛选;
2,不做人工交易只做量化。不做人工交易,人工交易没有盈利体系,上手纯量化,我一个认识了10年以上的朋友,中科大的数学高才,考上了清华硕士,但为了量化没去读,现在深圳,已经放弃了,因为他旁边也有2个是北大的一起,熬了几年也没成。其实从沟通的情况,我能确认,他们手工交易基本上很少,没有人工的体系,不能形成完整维度的因子,量化还是在一条分水岭上过不去。看过这些团队或个人,我认为还是在平衡人工和程序的决策权重上,即如上第一条碰到的情况,人工筛选程序运行的环境,以及极端市况的判断,来决策程序运行or停止。有大环境筛选,策略类型的优劣差别不大的,盈亏结果大多偏正向,你比如说牛市背景下,随便100个人来操作,也能多数人跑出利润,震荡和趋势都不适合的熊市环境,不买不卖的操作,也能跑赢90%以上的基金,不正是最好的诠释吗?
3,概率行了就成了。这个就是理解交易的角度是纯量化,特别是只做股票类的量化人员的思维,有些期货CTA就做的很好,有高盈亏比,低频交易,利润做的稳定。而大多在贝叶斯等概率理论、凯利公式里拓展不开的,这些思维估计也是限制他们更进一步的因素;
人工交易中讲究的是多角度相互印证,因子维度要具有差异,听量化的合作伙伴说,某一线券商自营量化团队里面,几个年轻人股指日内波段的量化出成绩了,模型用了200多个因子。

二,要选一条适合自己的路
1.认清自己很重要。自己要在那一块下手最具有优势,这个和成长有关,有人先接触外汇EA,有人先做人工交易后转量化,有人先接触期货,有人先做转债股票,各不一样。想好自己适合那一条,掌控量化的绳子终点还是在人的手上,也就是你的手上,有杠杆和没杠杆,策略频率偏好,等等,还是在你的性格和心态。
2.合作伙伴很重要。重要在于碰到问题的时候,解决思路上各自角度和知识积累经验不一样,能否相互提供借鉴和解题方案,能否相互打气,决定你能走多远和以后会碰到什么样的人。
三,准备架构,了解券商通道,争取优惠的费率和架构跟策略匹配的最优解。
1.高频,拼速度,拼设备的,得选C++,一般策略,不涉及盘口计算的,用python就差不多了,容易很多;
2.数据Api,通道,交易席位,平台,这些要了解各家券商的情况,多问几家。费用和速度不一样,有些一线券商的平台和通道不一定是一线水准,适合自己的策略和要求的就是最好的,不一定要烧钱硬上;
关键还是策略匹配,大多人和机构真的不适合拼速度,这个烧起钱来。目前一些百亿量化,光机房就得弄到足球场那么大,你自己何必呢。
四,参考书籍
目前我看到的比较有思维完整度和精准的,放心,非广告非知乎好物销售。
《量化交易之路 用Python做股票量化分析》阿布,机械工业出版社


《机器学习》,周志华,清华大学出版社


《因子投资:方法与实践》 石川,刘洋溢,连祥斌著,电子工业出版社



欢迎各路量化高手留言探讨指正·!~!~~!~!!有兴趣可以一起加入我们的群,人工交易和量化的高手相互切磋,汲取对方领域的营养。
关于这种成长贴1.0版本,就这样吧。我觉得我会一直更新自己的进步和跟各路高手沟通的一些信息,留做记录和纪念。

——————————————————————————————————————————————————————————————————2022年9月22日更新,成长贴2.0版本
第一个策略正在进行,期间深度沟通了6次和伙伴讨论的大致分4步走
1,先做图表框架再做资金、基本面等的因子,由简入繁;图表框架的程序表述,如果找不到量化的点,那可能会打转转挺久,尝试先从最简单的双底形态程序化,在程序表述过程中,也出现了量化点没找到,拆分成两个v,v的数据基础确定,时间,锚定,等都有很大的不适应;
2,数据分析和归纳,拟合人工交易完善因子;现在正在进入这一步,数据分析是捕获因子和因子匹配的关键,工作量最大的地方我认为就集中在这里;

3,测试优化,实盘后,动态调整参数或因子,二次优化,提出策略失效的前置方案;

沟通发现一些问题:
1,数据理解上,机器量化人员的思维和手工交易差别挺大。程序员测了第一版本的图表,出现数据并不符合原先设想的,即会认定逻辑失效,数据说明问题,用数据的结果来确认策略可能的结果,这时候他们就会认定这个策略行不通。而手工交易人的理解是,数据不符合,是拟合人工逻辑度不够,人工按照交易的底层逻辑设计的策略,数据没有跑出来,是拟合度不够,不会用数据来解释数据。数据头一天才测了几只个股觉得行得通,后面缩小范围测了几只低价股,发觉盈亏比数据不及预期,并不代表结果。数据是要全面看过,并通过跑出的数据,对比交易逻辑的设计思维,找因子归类,出现盈利数据好的那些组,找出他们哪些特征适合这样一个策略,适合这个策略里的配套因子,那从这个归类里面甚至可以单独做一个交易体系策略,因为手工交易中,很多高手就可能只操作一个市场特征来赚到丰厚的利润的比比皆是。
2,国内量化普遍存在的一些问题。量化团队或个人相互之间比较封闭,并没有开放的沟通,大家都是小学水平,还都藏着掖着。国外现在已经在往拟合人工的方向走,即用机器和量化对策略表现优劣不同的时间段或市场状态进行区分,归纳对应的市场,在符合特征的节点去执行,这里面的细节,他们都可以讨论得很深入;
3,因子失效的解决。程序员的解决方向,策略失效的归因会指向因子失效,失效因子出现,可能就放弃这个因子,留下有效的因子。手工交易的做法,可能是提前去修改或屏蔽未来可能出现的市场下可能失效的因子,或者停止这一个策略。如果是交易体系完整,因子扮演的角色在体系中是有权重评估的,不会因为某时间段失效而删除它,分析失效的原因,在下一次失效原因出现的时候规避。
4,量化方向的程序员可能不擅长判断策略内可能有很多因子重复描述一个逻辑,产生冗余。比如提到的某一线券商自营股指日内量化的团队,测出来的数据很好,200多个因子,但在手工交易中,可能多个因子都是在描述一个交易逻辑,且不能产生相互补充;
5,高频降频交易思维切换可能陷入一些交易逻辑上的陷阱,对盈利和交易体系的理解根据参数去变动。手工交易人的理解是:交易中我的逻辑和体系没问题,条件到达,我开仓进去,严格执行止盈止损,赚钱了,是运气,止损,那亏损也是应该接受的,中间不会过多关注盘中或时间长短,就一个字,等待,他相信最终的结果一定不会差。程序员的思维上,习惯性的用参数限定,测试出来后,以测试的结果来表现对策略的价值评估,比如,测试图表框架N,参数尚未优化,各类节点因子还未开始搭建,也没有按照既定的进场条件和出场条件完整组来(我给出的设定是高盈亏比+2到5:-1,条件符合开仓,按照预定结果要么止盈要么止损),即只测了其中一个最不具有优势的参数组,并且限定了一定时间周期内兑现,所有这些设定,都在缩小范围,增加不确定概率,而出来后表现不如预期,就出现动摇信心,甚至认为策略存在问题。这个可能是在没有手工交易逻辑和经验的程序员中普遍存在的,即用数据结果来解释数据。
我的预期里面,数据分析是一个庞大的系统工程也是极端重要的内容,工作量是极大的,1是要持续做对比——归纳——修正——因子匹配——测试——数据分析——归纳···不断的循环工作,2是数据分析也是一个交易体系搭建的过程,必须要完成逻辑正确与否的评估和因子匹配,烧脑!!!
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:400157
帖子:80032
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP