泻药~ 这个和猜猜科技当前做的事情有比较强的关联,我拣干货回答一下。 结论:效果不理想。 题主提到的应该是机器学习模型在股票市场的估值定价体系,能否成功找到中长期有效的阿尔法。答案是不能。 其中最核心的原因包括及格方面: - 股票(或者期货)的二级市场缺少足够有效的训练样本。这里的样本更多指的是一些特定时间的训练样本,比如次贷危机的样本,少的可怜只有一次。另一方面,由于市场基础设施和基础假设也在不断进化,80年的训练样本放在今天,同样不是有效的训练样本。
- 股票市场存在多个周期性的叠加,让预测增加了难度。这里面包括事件、宏观环境、行业周期、国家经济环境等多重因素形成的不同时间区间的预测周期。
- NLP等技术的快速发展,让自动化的文本分析、因子提取效率大幅提升。然鹅,最终并无明显效果。
- 最最核心的原因,是因为资本市场的训练样本和模拟样本,目前还没有找到代表性。换句话说,在binary的预测模型中,目前还没有机器学习模型能够明显有效的行程50%以上的准确率。用人话说,资本市场的昨天目前还没有办法证明可以预测今天或者明天。
这里的几点,可以比较好的用图像的机器学习训练来类比,机器学习的训练数据更加多,更加结构化,周期性更加一致,更重要的是,图像中的代表性问题不存在。所以图像语音是DL最好的落地场景,而金融市场目前还不是。 欢迎各大maga hege fund大神过来拍砖。 |