克利夫兰诊所和IBM的联合研究团队首次利用量子计算成功模拟了蛋白质的电子结构,这一突破性成果得益于新型量子中心超级计算研究的进展。
研究团队使用量子中心超级计算工作流程和IBM Quantum Heron r2量子计算机,对含有303个原子的微型蛋白质Trp-cage进行了建模。这项工作展示了量子中心超级计算算法和工作流程的设计与应用进展,该方法将量子计算和高性能经典计算相结合,产生了强大的效果。
在经典计算机上进行精确的电子结构计算随着系统规模的增加变得越来越具有挑战性。经典方法虽然能够高效地模拟蛋白质行为的某些方面,但对整个蛋白质进行高精度量子力学处理仍然不切实际。
如果量子计算机最终能够实现对大型生物相关分子的精确建模,这将对化学、材料科学和医学研究产生重大影响。这项工作代表了向这一目标迈进的重要一步。
"我有点不敢相信我们真的做到了,"克利夫兰诊所Merz实验室负责人Kenneth Merz博士说道。
Trp-cage蛋白质的选择与意义
Trp-cage对于基准计算化学方法非常有用。虽然它相对于蛋白质来说比较紧凑,但它具有生物化学中更大分子常见的特征,如疏水核心和组成部分之间的氢键,使其能够形成更复杂的结构。研究人员对其展开和折叠状态都进行了建模。
"证明这种方法对Trp-cage有效是迈向更大分子的一步,"论文共同作者Mario Motta表示。
研究团队对已取得的成果感到惊讶。Motta说:"起初计划只是模拟几个氨基酸。"但当他们测试工作流程时,发现能够一直扩展到Trp-cage并获得有意义的结果。
随着这些方法的成熟和扩展,Merz表示,他希望它们能够支持药物研究和相关领域的计算工作流程。他设想了一个科学家使用量子中心超级计算工作流程构建模拟分子行为数据库的世界。然后,当科学家需要特定用途的新分子时,他们可以使用在这些数据库上训练的机器学习算法,寻找可能以所需方式行为的分子。从那里,他们可以合成这些分子进行实际测试。
创新的波函数嵌入技术
该工作流程在arXiv上发表的最新预印本中有详细描述,依靠一种称为基于波函数的嵌入技术将Trp-cage分解为计算上可处理的片段,称为"簇"。在EWF中,簇的数量与分子中原子的数量相同,但每个簇比单个原子更复杂:它包含围绕原子的局部区域并与之纠缠。
在任何给定的蛋白质中,一些片段或簇将比其他的复杂得多。一个原子可能位于蛋白质的边缘,在共价键的末端,只与一两个邻近原子纠缠。在这些情况下,研究人员可以使用经典计算方法高效地找到该簇的电子结构。另一个原子可能更接近分子核心,陷入更复杂的分子间相互作用网络中。这些较大的簇是量子计算机要解决的好问题。
将各个簇计算的结果重新组合在一起,可以得到分子电子结构的完整解决方案,该结构描述了电子的位置以及它们如何相互作用——这是决定分子行为的重要信息。这种方法,即量子计算机与经典计算机在混合工作流程中的负载共享,是量子中心超级计算实际应用的早期展示。
突破性的SQD算法应用
Merz多年来一直关注量子计算的发展。直到几年前,很明显量子计算机可以为解决困难的化学问题提供新方法,但这些方法的具体形式仍然是一个开放的问题。
Merz表示,当他看到一群IBM科学家展示一种称为基于样本的量子对角化算法时,有了某种恍然大悟的时刻。
SQD属于为量子中心超级计算构建的新兴算法集,其中经典和量子资源协同工作解决问题,利用两种范式的优势。它解决了电子结构计算的基本挑战之一:分子电子可能配置的数量随分子大小组合式增长。
在SQD中,量子计算机对这个巨大的空间进行采样,识别经典计算机要关注的关键配置。经典计算机使用得到的信息找到解决方案。
了解SQD后,Merz说:"我们几乎放下了一切。我在周末与我小组中的几个人会面,我们决定全力投入SQD。"
他们开始对算法进行全面测试,在一系列较小的分子上进行测试,开始了导致这次Trp-cage模拟的实验链。到目前为止,结果非常有希望:在这篇论文中,工作流程已经与经典方法竞争性地表现,接近其中计算要求最高方法的准确性。
科学家们表示,原则上,EWF-SQD组合工作流程可以远远超越Trp-cage的规模。随着分子变大,分解它们、计算其最复杂簇并将它们重新组合的任务变得更加复杂。但解决复杂簇的电子结构对量子计算机来说是一个引人注目的问题。研究人员已经在探索下一步的样子,瞄准了更大的分子作为目标。
随着量子中心超级计算的发展,量子和高性能计算研究人员的合作至关重要。这项工作得益于密歇根州立大学和克利夫兰诊所高性能计算资源的支持。IBM与RIKEN等高性能计算领导者的其他最新合作也产生了令人兴奋的结果。
Q&A
Q1:Trp-cage蛋白质是什么?为什么选择它作为研究对象?
A:Trp-cage是一种含有303个原子的微型蛋白质,对于基准计算化学方法非常有用。虽然相对紧凑,但它具有生物化学中更大分子的常见特征,如疏水核心和氢键结构,能够形成复杂的分子构型,是验证量子计算方法的理想测试对象。
Q2:量子中心超级计算如何模拟蛋白质?
A:该方法使用波函数嵌入技术将蛋白质分解为多个"簇",每个簇包含一个原子及其周围的局部区域。对于简单的簇使用经典计算,复杂的簇则交给量子计算机处理,最后将结果重新组合得到完整的分子电子结构。
Q3:这项技术有什么实际应用前景?
A:随着方法的成熟,研究人员希望它能支持药物研究和相关领域。未来科学家可以使用这种技术构建分子行为数据库,然后利用机器学习算法寻找具有特定性质的新分子,为药物开发和材料科学提供强大的计算工具。