量化交易的本质完完全全就是统计学吗?

论坛 期权论坛 股票     
期权匿名问答   2023-2-14 13:13   5037   5
量化交易的本质完完全全就是统计学吗?
分享到 :
0 人收藏

5 个回复

倒序浏览
2#
期权匿名回答  16级独孤 | 2023-2-14 13:13:53 发帖IP地址来自 北京
量化交易的本质完完全全就是统计学吗? 其实可以换个角度来看这个问题,统计学能完完全全解决量化交易任务吗?

统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。
量化交易通常涉及使用数据,算法和计算机程序来辅助进行交易决策。量化交易从业者通常会采用统计学、机器学习和人工智能技术,以及财务投资理论,分析大量金融数据,以识别投资机会,以求获得可以持续的、稳定且高于平均收益的超额回报。
从定义我们可以看到,统计学的目的是对数据之间的关系进行分析预测,而量化交易的目的是为了追求稳定持续的超额回报的。
首先我们来看看量化交易中有那些任务需要完成?之前刚好看了一篇综述,里面总结了4类常见的量化学习任务:1.股票走势预测;2. 股价预测 ;3.投资组合管理 4.交易策略。我们就分析一下统计学是否能单独解决这4种问题。
[量化]万字综述,94篇论文分析股市预测的深度学习技术其中任务1和任务2可以看作一个任务,我们来分析一下统计学为什么不能精准完成股价预测(或股票走势预测)?



很多工作已经分析证明,股价是不可预测的。虽然统计方法可以对市场趋势和价格提供有价值的见解,但还有许多其他因素会影响股价。其中包括经济状况、公司新闻、地缘政治事件,甚至市场情绪。因此仅使用统计数据是不可能完全预测股价的。 总的来说股价不可预测的主要原因有三个:
市场情绪:市场受到投资者情绪的影响,这是定量分析无法预测的因素。
消息:投资者对新信息的反应可能会大大影响股票价格。消息来源也是投资者反应的主要来源,而投资者可能会根据他们的情绪和观点来反应不同的消息。
操纵:投资者和机构可能会有意地操纵股票价格,这也是统计技术无法预测的因素。
任务3,构建投资组合管理不能仅通过使用统计学来完成吗?



首先需要明确的是,仅使用统计数据进行投资组合管理不足以做出正确的决策。尽管统计数据提供了一些关于投资绩效的有用见解,但它没有考虑到市场的复杂性和风险, 也没有考虑到人为因素,例之前提到的市场情绪,消息和操纵。此外,由于市场的复杂性,统计数据无法提供投资组合整体表现的完整情况。因此,有必要结合统计分析和其他工具(例如机器学习,因果分析)来准确评估和管理投资组合的风险。
任务4,仅仅使用统计学为什么不能构建优秀的交易策略?

统计学只能提供静态的分析方法,它仅能提供对数据的分析。它无法预测未来的市场行为,而这是构建有效的交易策略必不可少的。此外,统计学也缺乏有效的风险管理策略,而这些都是构建有效的交易策略所必不可少的。另外,统计学也不能帮助交易者发现不同的交易机会,而这对于熟练的交易者来说也是一个重要的因素。 当前也有很多机器学习技术被引入用来构建交易策略,例如:强化学习,强化学习可以帮助构建优秀的交易策略,因为它有助于通过模拟市场条件来优化交易策略。 需要强调一下,这里提到的机器学习技术是虽然和统计学密切相关,但是我们并不认为它们是一致的。机器学习模型旨在使最准确的预测成为可能;统计模型被设计用于推断变量之间的关系。

最后用下图来总结一下,量化交易的最终目的是为了获得稳定的超额回报,影响的因素会有很多,包括好的数据(好的数据才有机会获得好的输出),编程能力(一个Bug就可能吃掉所有的收益),是否有金融知识(专家知识能够避免无效的试错,起到很好的指导作用) ,统计学和机器学习(完成数据分析和预测,构建交易模型),其它一些可以用来辅助提升策略回报的技术(能帮助提高收益的技术都是好技术)。最后要说明的是,运气也有很大的影响,我们也要避免把运气的影响归因到自己的策略。  

3#
期权匿名回答  16级独孤 | 2023-2-14 13:14:37 发帖IP地址来自 湖北
非常赞同 @kyuubi 的回答, 讲到了核心内容.
在经典的hands on algo trading那本书里, 作者就提到了, 量化策略分为两种, 一种是data mining driven(数据挖掘驱动), 一种是idea driven(想法驱动), 前者的收益和稳定性往往是远不如后者的.
统计学在量化交易中, 更多的是给你一个线索, 帮你提炼出有可能有用的一些特征, 比如说你发现, 每隔三个月的某一天, 美股会大幅波动一次, 这就是一个特征, 但是你只知道这个特征是没用的, 你得去研究这个事情的本质原因是什么, 你去看了一下日历, 然后发现, 哦, 因为每三个月美联储宣布一次加息, 类似这样.
可能有一些熟悉量化的朋友就会问了, 那为啥众多量化公司都在挖各种因子呢? 那不就是统计学吗?
答案很简单, 就是市场虽然是在变化的, 但是它变化的没那么快, 也就是经常说的动量效应, 所以有时候即使你是过拟合的策略, 短期内还是能盈利的, 但是失效非常快. 这种data mining的策略一大优点就是他的研发路线很固定, 可以通过堆人力, 堆机器来推广, 一个不行我就上100个, 100个还不行我就上10000个, 各种排列组合, 哪个表现好用哪个.
4#
期权匿名回答  16级独孤 | 2023-2-14 13:15:04 发帖IP地址来自 重庆
如果你是一个锤子,看什么都是钉子。

学统计的认为,量化交易的本质是统计学;学行为金融学的认为,量化交易的本质是行为金融学;学宏观经济学的认为,量化交易的本质是总量计量;学计算机的认为,量化交易的本质是计算机交易......
总之,大部分人对量化交易的认知还停留在“盲人摸象”阶段。
我们就按问题这条线展开说一下。这个世界解决问题的方法有归纳法、演绎法、类比法、溯因法、贝叶斯方法.....
1、归纳法,你也可以理解为一种“自下而上”的统计方法。

这是一门从“数据”到“算法”的学问。归纳法的算法形成靠数据,以这种方法为底层逻辑的对冲交易者和技术分析类交易者占到了90%以上,所以,才会有“量化交易=统计”的误解。
这种方法的问题是,如果你的“大数据”不能涵盖所有情况,那么,“黑天鹅”总会有出现的时候,这类交易者就会死于非命。
比如,两位诺贝尔经济学奖得主,默顿(Robert Merton)和斯科尔斯(Myron Schols)与梅里威瑟、美联储副主席大卫等人组成“华尔街梦幻组合”——LTCM基金公司,就因为此类事件巨亏了42亿美元。
2、演绎法,你也可以理解为一种“自上而下”的推理方法。

这是一门从“理论”到“事实”的学问。演绎法的模型形成靠想法,以这种方法为底层逻辑的很多是基本面量化交易者,他们用“大前提”推论“小前提”。
这种方法的问题是,演绎法有一个重要的假设,就是大前提是一个绝对真理(“绝对”的意思是,这个真理在任何时间和任何空间都能成立)。这样很容易高估这个理论的适用范围,使得整个推导过程变得不可信。
比如,价值投资的大前提是:所有好公司,其价值在长期来看,都会在市场上体现其应有的价值。从而得出一个小前提:我们应该在低估的时候买入,那么未来在某个时刻价值定会回归。结果:三年后发现这个公司退市了,变得一文不值。
3、类比法,你也可以理解为一种“比较分析”的思考方法。

这是一门从“特殊”到“特殊”的学问。类比法的逻辑形成靠外推,以这种方法为底层逻辑的交易者,认为这个世界存在很多通用的逻辑,可以把其他领域的学问,平移到交易中去的。你看,支撑阻力是不是有点像用牛顿的经典力学理论呢?
这种方法的问题是,你认为你在两种不同的事物中看到了相同的本质,但这种有限的“特殊”是不是可以总结成规律,这个有待商榷。换句话说,这需要你有非常高的智慧才行。
比如,波浪理论是美国证券分析家拉尔夫·纳尔逊·艾略特(R.N.Elliott)利用道琼斯工业平均指数作为研究工具而创建的一种理论。他把股价的波动类比于波浪,这就是类比。这种方法是对是错,我也无权评判,但真实情况是艾略特没赚到钱,江恩穷困潦倒而死,查尔斯.道也没赚到钱,李彪赚到了,却是坐庄赚的。
4、溯因法,你也可以理解为一种“结果归因”的实证方法。

这是一门从“观察”到“假设”再到“验证假设”的学问。溯因法是一种根据某现象的特征推测该现象产生原因的信息加工方式。这种方法利用了归纳法,但比归纳法多走了一步,即,用归纳法得到了假设,再去通过实践去验证这个假设到底靠不靠谱。
这种方法的问题是,如果归纳过程中的数据样本不够大,也就是说,你的样本量不足以支撑你得出一个假设,或者你的证据不足,那么你只能通过一些其他的逻辑对这个假设进行猜测,而且你的这些猜测也不允许你再去进行相关的实践。
比如,今年A股市场茅台的持续性下跌,大家可以找出一百种原因来解释他的下跌,但是到底是什么原因,你并不能通过实验寻出来,这就不能验证你的假设。所以,溯因法很容易又走回类比法的老路上去。
量化投资:五大类量化交易都有什么?5、贝叶斯方法,你也可以理解为一种“推论统计”的分析方法。

这是一门从“先验”到“后验”的学问。贝叶斯方法提供了一种计算假设概率的方法,这种方法是基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身而得出的。它与归纳法看起来有些相同,但结果不同,比如,不论数据如何,贝叶斯方法都不会得出100%的概率。
这种方法的问题是,不同假设的先验概率会得出完全不同的结论,而即使是假设的先验概率一致,也会因数据差异而得出完全不同的结论。这就是为什么使用机器学习(底层逻辑是贝叶斯)进行量化投资,成功者是少数,失败者占多数的原因。
比如,之前震惊币圈的量化跑路事件。当年,阿尔法、熊猫量化两个打着“数字货币量化投资”旗号的资金盘都已跑路。阿尔法平台宣传语是“3分钟收益25%”,而熊猫量化受害者上万,总计亏损过亿。
量化交易=定量分析+算法交易

时到今日,你仍然可以在百度上找到对量化交易的错误解释,即量化交易只是一种应用统计和计算机的一种方法。实质上,量化交易包括两层意思,即定量分析+算法交易。
A,对于定量分析,机器学习已成为一种流行的量化分析工具。但是,要记住,机器学习的好坏取决于给定的数据。如果你没有足够的数据,或者数据质量很差,那么你做出的预测就会不准确。
B,对于算法交易,可以这样描述,即涉及使用基于简单或复杂数学模型的计算机算法和程序来识别和利用的交易机会。这里的模型,来源于定量分析的结论。
量化交易的难点在于,有的人强在定量分析上,而有的人强在算法交易上,前者更重金融知识,后而更重计算机知识,可是,更难是的把它们联系起来。所有跨学科的交叉,从来都不是一件简单的事情,有时,不仅仅要靠金融、数学、计算机,还有心理学、博弈论等多种交叉学科的知识。
<a data-draft-node="block" data-draft-type="edu-card" data-edu-card-id="1604193788116570112">结语

量化分析和统计是您可以用来做出投资决策的两个重要工具。它们都是使用数值数据进行决策的过程。但是,这两个概念之间存在很大差异。很明显,量化交易不是统计学所能涵盖的事情。
以上回答,同学们可以点赞收藏。
有时间的,接看下面的高赞回答:
如何入门量化(326赞):学习量化投资怎么入门,有哪些参考书籍?
如何量化赚钱(780赞):你在国内亲眼见过自己一个人全职做 量化交易、并比同等相近能力的上班族赚得多很多的人吗?
如何去找工作(768赞):大家有没有觉得今年找工作特别特别难?
如何量化期权(100赞):做期权的人,为什么要看这本书
如何量化未来(204赞):有前辈介绍下量化交易未来的发展前景吗?
如何了解工资(194赞):请问国内量化私募研究员第一年工资是多少?
如何区分量化(161赞):量化交易和条件单有区别吗?不都是到达条件触发的东西嘛?
如何转型量化(101赞):30岁,量化开发做的不错,转量化研究员,能有多大概率转成功?
如何了解量化(290赞):量化交易的团队到底一天都干点什么
如何参加比赛(025赞):worldquant(世坤)大赛指南:做量化交易的,如何挖掘新因子
如何才有智慧(1453赞)女友收入比我高,但平常约会开销是我在负担。今天女友告诉我,她会理财,每月都存钱。问我为什么不存钱?
如何进行量化(圆桌题):个人做量化交易靠谱吗?
5#
期权匿名回答  16级独孤 | 2023-2-14 13:15:20 发帖IP地址来自 中国
同意答主 @kyuubi 的回答
构建策略有两种思路,一种是数据挖掘,在一堆数据中通过统计、归纳发现稳定的结构,常用的技术分析便是此类。由于价格数据是随机变动的,不太可能有持续稳定的结构,需要不断的迭代优化,但未来新产生的数据少,很难在少量数据里发现新的稳定结构,所以,当历史数据的统计规律一旦失效,策略也基本就丧失价值了。这种策略的开发路径是先有数据,再挖掘规律,再不断的优化迭代。
第二种是逻辑论证,通过数学推导得出一个结论,例如平价套利理论,通过计算会得出一个套利边界,只要价格超过边界,就存在套利机会,无论价格是怎么变动的,只要超过套利边界,就有套利机会。这种策略的开发路径是先逻辑推导出规律,再对基础条件迭代,例如利率的变动、储藏成本的变动,会得出不同的计算结果,用新的计算结果等待价格触发的交易机会。
6#
期权匿名回答  16级独孤 | 2023-2-14 13:15:32 发帖IP地址来自 北京
并不是的。
如果策略纯基于统计学,代表你不知道盈利的原因,当资金大幅回撤时,你不知道是正常回撤,还是策略失效。
所以,纯统计学的策略,属于高风险策略,你不知道为什么赚钱,也不知道为什么亏损。这种策略只能用客户的资金跑,你们共担风险,因为你自己可能担不起。
因为你说不清怎么盈利,自然也就无法调整和精进。所有的调整,都是修改一些参数,看看效果怎么样,以求拟合历史行情。
而市面上恰恰95%以上都是这种策略。所以你会觉得量化就是统计学。
这种策略不是不能跑,也不是不能商用,只不过盈利还是亏损,都是随机的。看客户的运气好坏罢了。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:400157
帖子:80032
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP