DolphinDB Shark!一个基于遗传算法的自动因子挖掘平台
创始人
2024-08-29 11:01:55
0

DolphinDB 推出的 CPU-GPU 异构计算平台 Shark,将 DolphinDB 上的复杂指标计算能力无缝切换到 GPU 算力平台,大幅提升了计算性能。Shark 最新版本给开发者提供了两个主要功能:因子挖掘和因子计算。通过使用遗传算法,因子挖掘功能能够从历史金融数据中提取出有效因子,提高金融数据分析的质量和效率。因子计算功能针对金融领域,提供了丰富的函数库,为大规模金融数据分析与处理提供了完整解决方案。

自 2023 年 DolphinDB 正式加入“NVIDIA 初创加速计划(NVIDIA Inception)” 以来,双方技术团队持续开展技术交流与探讨。此次,DolphinDB 开发团队与 NVIDIA 团队合作,通过利用 NVIDIA RAPIDS 加速 Shark 异构计算平台的因子挖掘算法运行效率,帮助 Shark 将因子挖掘的效率提升 2 - 10 倍;并基于 NVIDIA cuDF 实现 Shark 因子高效计算,大幅减少开发成本,缩短开发周期。

RAPIDS 的 RMM 是一套开源的内存/显存管理库,提供 C++ 和 Python 接口,它相比 cuMalloc, cuFree 等操作来讲,具有更好的性能和灵活性;RAPIDS libcudf 是基于 GPU 的 C++ DataFrame 库,提供了基础数据结构,并且内置了基础的函数算子。

当前挑战

Shark 的因子挖掘功能,通过利用遗传算法从数据中挖掘出有效的因子。在这一场景中,遗传算法会随机生成大量因子并进行计算。这一过程会频繁地创建和释放临时空间来存储中间结果,直接使用原生的 CUDA C 显存分配和释放接口,会严重降低执行效率。

Shark 的因子计算功能,针对金融领域的数据分析与处理,提供了丰富的函数库。如果从零开始将 CPU 的函数迁移至 GPU,需要为 GPU 重新实现一套底层数据结构以及基础计算函数,会导致开发周期的延长以及开发成本的增加。

应用方案

基于以上挑战,DolphinDB 开发团队与 NVIDIA 团队及 RAPIDS 开发团队合作,通过利用 RAPIDS RMM,解决因子挖掘过程中频繁申请和释放显存导致的性能问题;通过基于 RAPIDS libcudf 进行二次开发,实现因子计算,从而缩短开发周期,降低开发成本。

Shark 进行因子挖掘时,会通过遗传算法随机生成海量的因子计算公式。这些公式长度不等,接受的参数数量也不尽相同。因此在计算时,需要频繁地申请和释放临时空间用于存储中间结果。DolphinDB 开发团队通过使用 RMM 对显存进行池化,从而对中间结果所使用的显存进行高效地分配、释放和重用。

Shark 支持用户输入自定义的公式,并自动将自定义公式转换为计算图,并在 GPU 完成计算,从而加快数据分析和处理的效率。如果从零开始将 DolphinDB 的计算函数迁移至 Shark,需要在 GPU 构建 array、table 等底层数据结构,并实现大量基础计算函数。经过调研后,DolphinDB 开发团队决定基于 RAPIDS libcudf 进行二次开发,复用 cuDF 的 column、table 等底层数据结构;并借助 cuDF 的 groupby 和 rolling 框架,只需要完成算子的核心计算逻辑,即可完成 DolphinDB 时序算子和横截面算子的迁移,极大提升了开发效率,降低了开发成本。

效果展示

下图展示了在不同规模数据下,使用 RAPIDS的 RMM 显存管理库相对于原生的 CUDA 显存分配 API,Shark 因子挖掘效率的对比。可以清楚地看到,使用 RMM 可以显著提升 Shark 因子挖掘效率,最高可达到 10 倍的加速比。

除此之外,Shark 通过使用 RAPIDS libcudf,大大提升了因子的计算效率。下图中对比了 1000 个 group,每个 group 有 10 万行的数据,采用分组方式计算下面的算子。可以看到与 CPU 相比,利用 GPU 总体耗时(包含拷贝时间),基本达到了一个数量级的加速比。

借助 RAPIDS,Shark 的因子挖掘效率提升了 10 倍。除此之外,基于 cuDF 进行二次开发,只需要实现算子的核心逻辑,就可以达到一个数量级的加速,并极大降低了算子迁移成本。

相关内容

热门资讯

学者倡导多方赋能科创事业 实现... 中新网上海9月22日电 “科创是我们的未来,而且是没有第二个选择的未来。我们要用学校的力量、专业的力...
以《三体》IP为启发 全球首个... 封面新闻记者 张杰图片由三体宇宙提供 《三体》小说从在《科幻世界》杂志上连载开始,至今已18年。从8...
科技巨头联名致信欧盟,能否叩动... 来源:第一财经 欧盟对人工智能(AI)的“碎片化”监管正在阻碍自身的发展? 近日,社交平台Faceb...
叮咚!您点的海鲜正在“飞”来的... 这是全国首条海岛低空公共物流航线,这条航线的开通,将陆岛物流时间缩短为半个小时以内,像医疗物资、包裹...
青春华章丨人民网评:让青春在创... 从天宫、北斗、嫦娥到天和、天问、羲和,中国航天不断创造新的历史。这背后,有一大批航天青年挑大梁、担重...
RDSA产业联盟在珠海成立 中新网珠海9月20日电 (记者 邓媛雯)RDSA产业联盟(RDSA Industry Allianc...
索尼WF-C510真无线耳机在... 【CNMO科技消息】近日,CNMO了解到,索尼在印度市场推出了其全新真无线耳机——WF-C510,售...
原创 研... 土星环是太阳系最壮观的天体结构之一,它由一系列同心的、但密度和亮度上都不同的小环组成。 土星©NA...
苹果:人近中年 来源:36氪 编者按:苹果每年的产品发布会越来越乏善可陈,苹果在服务上的收入正在逐渐逼近产品收入。曾...
助力国产化替代 行星滚柱丝杠让... 行星滚柱丝杠 行星滚柱丝杠 大众网记者 邢晨 烟台报道 “我们的目标是成为精密线性传动市场国产化替...
小红书图文矩阵可行吗?知乎自媒... 小红书图文矩阵可行吗?知乎自媒体如何管理? 随着互联网的快速发展,内容创业成为越来越多人的选择。小红...
成都未来医学城首个院士科技成果... 9月22日,成都未来医学城首个院士科技成果转化项目——安可兴先进医美材料生产基地正式投入使用,这不仅...
原创 6... 9月22日,iQOO公布了Z9 Turbo+的更多配置和细节:除了天玑9300+以外,还有自研电竞芯...
华为摊牌:将抛弃安卓、wind... 来源:科技创新plus 华为一向敢为人先,最近推出了全球首款三折屏,引爆了手机市场。 而在手机市场之...
原创 进... 对于生命的探索,我想自古以来就不曾中断过,千百年来依旧是得到了无数人们的争论,而对于大众而言,整个的...
填补空白!又一古生物新物种以“... 9月20日,记者了解到,国际刊物《化石记录》发表的一篇研究论文报道了我国发现的二叠纪首个透翅目昆虫。...
广州首创:科技传播发展有了评价... 文/羊城晚报全媒体记者 李钢 9月21日,在广州市全国科普日主会场活动启动仪式上,广州发布国内首个区...
原创 英... 01 最近,外媒《华尔街日报》率先报道了高通与苦苦挣扎的芯片制造商英特尔接洽,考虑收购后者的相关事宜...
原创 由... 9月22日消息,据供应链消息,苹果Macbook轴承供应商科森科技由于产品“质量问题”,已经被苹果公...
台风过后,TA们迅速行动,修复... 为确保台风过后城市市容环境和秩序快速恢复,天目西路街道综合行政执法队根据街道相关工作要求,第一时间组...