为什么棋类游戏最先被 AI 攻克?我们来看棋类游戏的特点:1、信息边界明确,状态有限;2、所有信息完全公开透明;3、游戏在有限步内结束,有明确的胜负判断标准。这几点造成了棋类游戏的的整个状态空间是有限确定的。以围棋为例,每个交叉点上是黑子/白子/空三种状态,一共 种局面,之外的任何信息都对策略没有影响。就是一只猪,把每个局面最优着法记下来,也成了围棋之神。当然,以目前的技术列出围棋的全部局面是不可想象的,但是计算机相较于人的长处正是海量数据的存储与高速运算。因此计算机在棋类游戏中击败人类就不足为奇了。
再看投资领域,与围棋相比在上述几个特点上都显著的更为复杂。与围棋的全部信息都在棋盘之中相比,对于投资你很难预先确定整个问题的信息边界。这对于现阶段的 AI 已经构成了天大的挑战。现在的 AI 从技术以及形态上显然无法像人类一样主动去现实世界探索信息,那么如果让 AI 去投资,整个系统的输入是什么?哪些信息是相关的哪些信息是无关的?对于投资这种开放性问题,大千世界的任何信息都有可能会对决策产生影响,信息量巨大而信噪比极低。AI 不可能获取到一切有可能有意义的信息,从目前常见的做法来看,除了各类报表数据,就是接入互联网,从新闻以及舆论中挖掘一些有意义的信息。但这远非投资需要了解的全部,反而引入了大量的噪音。
另外棋类游戏有确定的结束标志,存在明确的胜负标准,这也对 AI 的学习提供了极大的便利。最新的 AlphaGo Zero 版本正是依赖于此,让程序从 0 开始,不断的自我对弈以提升棋力。其背后唯一的逻辑很简单:一盘下完了,赢棋方的着法总是比输棋方走得好。这其实是一类非常特殊的问题。深入分析一下,围棋 AI 希望尽可能的提高棋力,而对弈胜负正是棋力真实客观的外在量化标准,可以直接测量、反馈。作为 AI 只需要不断地追求胜利即可,这个量化目标与根本目的是完全一致的。同样的事情放在投资上就不那么显然了。选出中国平安的策略比较厉害?还是选出贵州茅台的策略比较厉害?我们希望尽可能的提高 AI 的投资能力,但是这个投资能力缺乏一个明确的可量化评测标准。我们只能利用唯一的历史数据,使用类似“近十年的投资信息比率”、“近五年的收益率”等代理指标。但是我们应当清醒的认识到,这些简单指标均无法完全准确的代表投资能力。过于片面的追求这些指标的优化,还容易陷入过拟合的风险。
目前取得重大进展的以深度学习为代表的 AI 技术,本质上还是基于数据的统计,是一种高维空间的模式识别。这使得 AI 无法“理解”任务内容,在 AI 看来所有的任务都是寻找 使得 的过程。这样 AI 的效果将极其依赖于给定的输入 X 与输出 Y。前面两节已经提到,在投资任务中,输入 X 中包含了大量的垃圾信息,又将很多真正有意义的信息排除在外;输出 Y 又不易准确量化评价。对于人类来说,存在大量的领域背景知识,可以轻松的滤掉“显而易见”的无用或错误信息。但是现阶段技术下,这种领域背景知识很难迁移到 AI 中。AI 将对所有信息一视同仁,努力在其中发现模式,而这种模式将完全不同于人类的思维和理解方式,对于人类来说几乎是一个黑箱。这等于 AI 放弃了人类文明千百年来的持续积淀,仅通过目前人类给他划定的一部分信息,采用不同于人类的方式自学成才。对于围棋来说,棋盘上的信息是完全的,人类的所有领域知识积累都可以从棋盘上推演得到,人类的知识显得“多余”了。但对于投资来说,涉及的信息无法穷尽,此时放弃人类知识就是非常危险的。那些人类闭着眼都不会踩到、甚至根本无法意识到其存在的坑,都很可能就会让 AI 阴沟里翻船。更何况现在的 AI 对于针对性构建的恶意样本还非常脆弱,一旦被人恶意利用,后果不堪设想。
同时,现阶段的 AI 投资还面临一个重大挑战就是数据匮乏。从基于统计的机器学习开始,到现在的深度卷积神经网络,对于复杂的问题采取了使用海量数据学习以暴制暴的方式。AlphaGo 对弈了数百万盘围棋,达到了人类的水平。而一个人类棋手从学棋开始至达到职业水平的对弈数连 AlphaGo 的零头都不到。在这一点上,目前的 AI 与人类的思维方式还有着显著的差别。AlphaGo 击败了人类也不意味着机器就比人更聪明。
人类的优势是对复杂数据进行高层次的抽象,大道至简;而深度学习算法则是充分发挥机器的优势,以量取胜。这使得人类能够从少量的样本中总结出深层次的简单规律,并利用这些规律做出各种预测;而 AI 在目前阶段无法做到这一点。观察到苹果落地,牛顿总结出是因为地球的引力,据此发展出万有引力定律;爱因斯坦总结出是因为地球质量造成时空弯曲,据此发展出广义相对论。他们都通过少量(相对 AI 的训练数据规模)的观察准确的抽象出了高层次的一些规律。
在小样本上的学习能力、深层次规律的抽象泛化能力,人类远远强过 AI。如果巴菲特是 AI,他可能需要看过 100 万家“可口可乐”公司的成功,才能在实际中选出可口可乐。但很可惜,可口可乐公司只有一个,历史也只有一次。对于 AI 来说,这样的学习数据实在是太少了。现阶段的 AI 算法,如果学习数据太少,会非常轻易的陷入过拟合的陷阱 —— AI 记住了所有的学习数据,而非其中真正能够持久生效的一些深层规律。从投资到计量经济学,都注定了只有唯一的历史数据可以学习,时间持续流逝,环境不断变化,你也无法控制同样的环境反复的实验验证。此时就要求必须能够从这少量的甚至是唯一的样本中总结规律。现在 AI 言必称大数据,而爱因斯坦 100 年前没有任何实际的观测,通过“零数据”就预言了引力波的存在,直到 100 年后的今天才被实际观测到,这种能力现阶段的 AI 是无法企及的。专家们早已注意到了机器学习过于依赖样本的局限性,小样本学习的问题已经被推到 AI 领域前沿,但迄今未出现像深度学习算法这样的重大突破。目前 AI 仍然无法脱离模式识别的范畴,我们离实现真正的智能还有很长的路要走。
尽管整个投资任务对于 AI 来说过于宽泛复杂了,但 AI 在一些特定的具体领域任务上足以与人类媲美,已经证明了其巨大价值。AI 的长处在于大量繁杂数据的高速处理,而人类的长处在于化繁为简,达到更高的抽象层次。人类和机器具备各自独特的优势而又能够有效互补。对于投资来说,AI 可以作为工具,帮助人类去高效的完成一些特定环节。我们仍然应当以人类投资的成功经验为基础,在其中一些特定环节上由 AI 替代人类高效完成。目前我们关注研究的重点不应当是 AI 如何替代人类做投资,而是如何作为工具帮助人类更高效更好的进行投资。将 AI 引入投资领域的商业本质仍然是效率的优化,是时间、成本、质量之间的平衡。AI 的引入能够大幅降低低端人力成本,提高企业投资业务处理能力,从而获得更高的边际效益。作为专业投资者应当拥抱这种变革,深入理解 AI 技术、了解 AI 的优势与局限、让 AI 为投资发挥其最大的效能。