机器之心发布
机器之心编辑部
这是量化投资最好的时代,行业认可度不断攀升,优秀人才群贤毕至,更多的技术玩家深入探索无人之境……
这也是量化投资「最坏」的时代,更激烈的竞争法则和残酷的淘汰机制,意味着只有不断翻越层层技术高峰,才能「一览众山小」。
2023 年,踏入「万亿」时代的量化私募行业开启了以硬件战争、算力竞赛、天才博弈著称的内卷之争。从野蛮生长到精耕细作,如何面对技术与智力比拼不断升级的行业生态?
在国内市场稳步走过十个年头的宽德投资,正以自身的经验破题。让我们一起来看看宽德人给出的答案。
以严谨的学术态度,待技术风起
当清华数理基科班的 Elric 选专业时,世界正迎来数据极速膨胀的时代,统计学作为数据科学中的重要基础部分,在现实生活中的应用领域日趋广泛。
可选方向多样化的同时,如何将自身兴趣点与学界、业界的需求强有力地联结?听了几场归国老师们分享学术、业界前沿的讲座,并和在 UCLA 交换时的导师交流学习心得,尤其是在了解到统计学与大热的机器学习间千丝万缕的联系,Elric 锁定了航行的起点。
统计是从海量的数据中探究未知规律,在看似无序中寻找有序,这需要长期保持对科研的严谨与坚持。蒂莫西・高尔斯曾做过一个有趣的比喻,他说数学中绝大多数影响深远的贡献都是由「乌龟」而不是「兔子」们做出来的。这意味着,在长期研究的时间刻度里,只有反复与数据、模型的切磋,或欢欣鼓舞,或痛苦难捱,那些突破性成就才能缓慢来临。
随后,在伯克利读生物统计的几年,Elric 一方面训练做学术研究必备的科学素质,另一方面在众多前沿领域深入探索。多重假设检验、贝叶斯模型、生物信息、药物基因组、图神经网络、非凸性学习理论,他的研究范围从统计学、计算生物学延伸到了机器学习。
Elric 在海外读书的阶段,正值国内量化交易市场突飞猛进。虽然海外市场的交易工具更齐全、市场要素更友好、资本更成熟理性,但也面临着策略同质化加重、马太效应明显、过度依赖杠杆和低成本融资等诸多问题。与之相较,虽然国内市场交易发展处在相对初期阶段,但市场更具活力、行业方兴未艾,这实际上为量化交易,尤其是年轻的从业者提供了更多想象力和成长空间。
从技术角度来看,国内最顶尖的量化交易机构正在迅速地追上海外顶尖机构,甚至在细分技术方向有自己独特的优势。虽然起步晚,国内机构的后发蓄力优势明显,不论是 SOTA 深度学习技术的应用,还是大规模 AI 计算平台的建设、高性能的软硬件交易系统的设计,以宽德为代表的国内量化交易机构走在了前沿。这股技术的东风,扬起了 Elric 在宽德启航的风帆。
宽德所有交易软件、框架皆为自主开发,并能跟随市场、交易所交易规则、政策进行动态调整。
博采众长时,坚定追求极致的初心
时代的需求像红绿灯一样引导人才有序地流动,随着技术革新的加快,国内越来越多的金融机构采用机器学习算法来预测市场趋势和选择投资组合。目前,对传统机器学习(如核方法、树模型等方法)和更为广阔且高速发展的深度学习的研究与应用,成为金融机构,尤其是量化行业的「兵家」必争之地。
PhD 毕业后,Elric 加入宽德成为了一名机器学习研究员。目前,Elric 的工作聚焦于数据挖掘、设计模型方案和策略,运用机器学习的方法破解金融市场的各种谜题,在海量数据中发现高维度、非线性的联系,量化给了他更广阔的展示天地。
「宽德有很多独立数据源、超大规模的计算资源和强大算力支持,为我们倾力打造了优越的工作环境。比如给我配备了充足的 A100,我不用像学生时代一样担心资源不够用,工作效率得以大幅提升。」Elric 介绍道。
研究的领域在不停地拓展,如何淬取手中的工具成为「利器」?Elric 认为,越是能够集众人之所长,通力合作的团队,越能长缨在手。宽德的团队内部既有专攻理论数学、理论物理的同事,也有学习工程、统计、数值计算的成员。在宽德,他遇到了 IPhO 金牌得主、游戏大神 + 数学博士、花街资深老兵、天才实习生等等出众的同事,他们闲时经常互相切磋,从各自的专业视角出发,提供更加完整、全面的解决思路。
「我们众多的『物理金牌得主们』经常会以洞察物理规律的思维去思考金融规律,这种碰撞时常能使得灵光迸发。比如,在金融工程中有名的 Feynman-Kac 公式,就是著名物理学家理查德・费曼在描述高能粒子分布时搞出来的。就算同样是数学专业,PhD 研究方向是拟蒙特卡罗方法的『游戏大神』同事,在做建模、训练、推理时,也都能常常给我新的思路。」这些来自不同领域的见解,帮助 Elric 开阔了做研究的视野,不至于被单一的思维模式固化陷入僵局。
背景多样的少年英才团队更具凝聚力和竞争力。
让心智保持对新思想、新成果的开放状态,Elric 犹如吸水的海绵一样不断充实自我。宽德搭建了一系列的内部知识体系,无论是关于最新统计方法,热点机器学习、人工智能算法,还是编程范式、工具链的使用等等,都会定期地安排课程,帮助同事们自我沉淀,实现知识共享。
「学习统计的在校同学们,还是要扩充相当量的计算机科学领域知识。最近,我正努力提升自己相对薄弱的工程能力。从基本的编程技能到理解计算机科学的整个生态,如数据结构,算法,计算机组成原理、操作系统、数据库,编译原理等。」Elric 每天还会固定地花些时间看看 arXiv 和业内最新的文章,「一些关于 GNN 和 Transformer 模型的文章都曾给我启发,维持自己对学界的嗅觉,不能因为开始工作了,就丢掉一些功课。」
运用最新的机器学习技术来解决实际问题,去创造真实、可衡量的价值,是技术人才们永恒的追求,也是他们长此以往追求极致技术的本心。而宽德,就是呵护这些本心的「象牙塔」,对于多元化的探索与极大程度的包容,激发了「后学生时代」人才们的研究动力。同时,宽德为这种动力武装了成熟工具和科学方式,让大家能够全身心地投入其中,研究金融中的技术之美。
受益匪浅中,探寻技术与价值的和谐
时至今日,机器学习、深度学习、强化学习等技术正极大重塑着量化交易行业的技术格局,为量化交易的发展打开新的局面。例如,量化交易领域会广泛地从 SOTA ML/DL 的相关研究中吸收养分。但吸收并不等于拿来主义,如何正确使用某一深度学习技术?在低信噪比时,如何判断是数据的局限还是训练过程的偏差?诸如此类,都是量化交易行业需要针对新场景、新问题进行的调整。要从自己熟知的领域去逐步拓展认知的边界,一步一个脚印把基础夯实,努力做到「知其然更要知其所以然」。
随着工作实践的深入,Elric 逐渐体会到,量化是「具体技术实现」与「对于市场独特价值」的有机结合。他引用宽德创始人冯鑫博士在世界人工智能大会的演讲:「量化投资可以建立并利用股票间广泛的关联,把整个股票市场建设成流动性共享,冲击分担的有机整体。从机器学习的视角看,我们可以把股票从 one-hot 编码这种非常稀疏的高维空间向一个稠密的低维空间嵌入,这个过程叫做 embedding。基于此可以通过 attention(注意力机制),研究股票之间点对点的关系,借此把股票间的关系转换成这个空间中坐标之间的关系,这正是 GAT(Graph Attention Networks)范式的核心思想。引入这个机制后,一只只单独的股票被织成一张网,信息在这张网络中流动。单点往往是容易被突破的,但是在这张网络中,每个节点都得到了加强,对某一点的压力会被分担到整个网络上,由此全市场也共同分享了流动性。在这张网下,大幅减少了交易的冲击成本,让股票在二级市场可兑现的价值更加稳定充足。」
冯鑫博士在世界人工智能大会上,以机器学习视角解读量化投资如何促进市场高质量发展。
「冯博士举的这个例子体现出一种集优雅的技术与其市场意义为一体的和谐。通过 GNN 这样表述对象间关系的深度学习方法,为股票间建立一种互利互补的关系,为市场建立起更稳健有效的结构,仿佛把几千只股票锻造成了一个整体。」Elric 说道:「冯总和我一样都是学习统计出身,他有二十年海内外量化实战经验,对诸如模型解释性、如何处理过拟合等方面积累的经验让我受益匪浅。宽德就是在这种花街老兵和年轻人的碰撞中,不断产生创新的火花。」
在分秒必争的市场竞争中,宽德有这样一群稳扎稳打、不断求索的极客,在内卷袭来时,必将屹立潮头。