业绩远超巴菲特和达利欧,西蒙斯怎样做量化投资
时间:2023-04-28 00:00:00来自:第一财经字号:T  T

1

先让我再一次引用恩格斯这段著名的“合力论”——

“……有无数互相交错的力量,有无数个力的平行四边形,而由此就产生出一个合力,即历史事变,这个结果又可以看作一个作为整体的、不自觉地和不自主地起着作用的力量的产物。因为任何一个人的愿望都会受到任何另一个人的妨碍,而最后出现的结果就是谁都没有希望过的事物……”

我在一篇文章里写过,战争与革命都是这种“谁都没有希望过的事物”。现在这篇涉及投资、数学、人工智能、机器学习,你会发现,它们也是。核心便是,影响人的选择以及事物变化的因素太多了,并且这些因素之间还不断地相互反馈循环作用,这使得你几乎不可能真正准确地预测其走向;所谓对的预测,绝大多数只是运气够好,剩下的,则是预测的模型在一段时间内因为抓住了最重要的几个变量而显得相对成功,但你的成功反过来已经改变了所有变量(包括那些你没有纳入模型的变量)及其作用方式和相互关系,因而时间再拉长一点,只要你陷在成功的模型里(人性决定了你很难不陷在里面),你一定会撞墙。

恩格斯的“合力论”虽然大体沿用了19世纪略显僵硬的形而上学语言,但20和21世纪最前沿的数学研究,比如非线性偏微分方程,比如高维拓扑流形,再比如它们当下的实际应用——机器深度学习,究其本质,无非是用更科学和严格的方式,重写了“合力论”——所谓“无数个力的平行四边形”,无非现代数学中向量和向量丛的二维简化版罢了。

而我常常觉得,人们之所以对“量化投资”之类炫目的新事物一开始就抱有深深的误解,其根本便在于对真正的现代数学,包括以现代数学语言重写的恩格斯“合力论”理解太肤浅。

以下是我在知乎上读到的一位“专业人士”(个人标签是“算法设计人工智能”),基于(对大数据和技术分析的)陈腐之见,对量化投资所作的非常典型的一种“误读”:

“基本原理,短线、高频交易,即所谓的‘见利就走’。所谓的‘见利’是基于预测模型的‘实时机器学习’模型,对某个操作对象的价格数据实时监测进行序列价格曲线拟合,得到预测曲线y=f(t)和误差概率P(t),其中t为预测未出现序列号,y为该序列号时的价格,计算机根据跟定的希望获利值(此时的买进价和预测卖出价的差值),程序化自动下单。因此,西蒙斯量化模型完全不考虑外部条件(x1,x2,x3……xn)对价格的影响,只关注价格变化,快速买进卖出做高频短线交易,虽然每单获利很小,但保证高频获利的前提下,赢得最大获利概率Max[P(t)]。”

这种误读的关键,正在于经验让他难以超越低维度的视野,将数据及其建模仅仅视作“曲线”以及曲线与数据之间的简单“拟合”。而事实上,我们知道,以詹姆斯·西蒙斯在微分几何领域的数学成就,以文艺复兴科技公司所聚集的那数百位顶级的数学家、物理学家、天文学家、生物学家对真正前沿的数学的理解,这里出现的模型起码应该是“曲面”,更大可能则是任意维度的拓扑流形。

2

文艺复兴的模型为什么如此神秘?为什么至今没有离开的人能真正“泄密”?除了用人合同中严格的保密条款(其实我觉得其中故弄玄虚的成分居多),更大的可能,在于它压根儿很难被泄密,敞开了让你抄,你也不会抄。正如文艺复兴的高管们所透露的,连他们自己都无法确切地知道公司为什么会赚钱,为什么会亏钱。用非线性偏微分方程处理数据+高维拓扑流形建模+机器深度学习,其中每一样都是高度流动、自组织演化的,并没有一个可以让你直接抄下来用的方程或图表。特别是机器深度学习,其基于海量历史数据的高维模型(想想弦论中的六维卡拉比-丘流形),随时随地都在不断自我修正、深化、变形和涌现中,你抄什么?抄一个切片有什么用?

量化的高维建模与常见的统计学建模的最大区别,我以为在于统计学更多考虑的不是作为原因的变量及其相互作用,而是最终结果的概率分布,因此统计学模型或许在理论上非常有力,却不见得有多少实践价值——你按照统计学分布去投资,很可能会踩坑,因为统计学分布是大量结果的综合效应,而你的每一次投资却是一个当下的、高度不确定的一次性事件;按统计学分布去做,总体上固然有较高的获利概率,但你很可能没有足够的资本,在统计学效应足够显著以前,你就输光了。

而高维流形建模并不是仅仅基于概率,而是基于对大量可能相关的变量的辨认、筛选与测试,与统计学模型的“事后特征”不同的是,它完全是即时反应型的,时刻在(自动)调整模型中变量的特性、数量与相互关系。在人力计算时代,这当然是非常困难以至不切实际的事情——绝大多数多变量的非线性偏微分方程,在数学上是极难甚至无法求解的,数学家们在这些领域的核心工作,早已从求解变成了估值,甚至不是对解本身估值,而只是对可能有多少个解进行边界估值。但是计算机尤其是深度学习,让数据的高维建模变得现实了。计算机的高速数据处理能力,使其能在无数变量中出入自如,对这些变量及其关系进行大量的筛选、评估和运算;而深度学习使得计算机能够在人的脑力完全没有能力处理的层面上,通过大量的比对、拟合、回测,来自动建模、运转和改进。

本站郑重声明:所载数据、文章仅供参考,使用前请核实,风险自负。
© 2008 北京济安金信科技有限公司 北京合富永道财经文化传媒有限公司
京ICP备12044478号 版权所有 复制必究
本站由 北京济安金信科技有限公司 提供技术支持