华大与量旋科技联合开发长短读长混合组装量子算法,助力量子计算应用研究

企业动态 量旋科技 2024-07-16 09:09

近日,深圳华大生命科学研究院联合量旋科技,共同开发了基于长短读长混合从头组装的量子算法,基于量子计算实现了带有重复序列和测序错误的从头组装。相关研究成果于4月23日在国际期刊《PRX Life》上发表。

在这篇研究成果中,研究团队创新性地开发了一种可以在量子计算机上完成含有测序错误和重复序列的基因组从头组装任务的量子算法。整个工作大致可以分为三个部分:

一、基因组组装问题转为QUBO问题

根据二代测序技术得到的数据构造德布鲁因(de Bruijn)图,并引入三代测序技术得到的数据来确定重复基因片段的位置,构造目标函数。最后根据从头组装算法需要满足组装路径是连续的单路径作为约束条件,并结合目标函数构造无约束的损失函数。

二、使用分布式VQE算法进行求解

基于传统VQE算法,使用分布式计算的方式,将大的QUBO问题分成多个小的QUBO问题,并生成多个比特数较少的参数化量子态,构成传统VQE算法中的量子态,最后将多个小的QUBO问题和多个比特数较少参数化量子态进行期望值测量,优化迭代,最终估算得QUBO问题的解,即测序片段的正确组装顺序。

三、根据问题设计问题启发式参数化量子线路

根据QUBO问题中变量的取值情况以及约束条件,设计问题启发式参数化量子线路,以实现生成的参数化量子态仅包含问题的可行解,减少搜索空间,提高算法性能。

华大与量旋科技联合开发长短读长混合组装量子算法,助力量子计算应用研究
图1. 基于分布式VQE算法的基因组组装流程示意图

该研究创新性地在量子计算机上解决了带有重复序列和测序错误的基因从头组装问题。同时,通过使用分治策略和设计量子线路,实现了量子资源的节约和性能的提升,为探索量子计算在生命科学领域的实际应用做出了努力。

该研究团队基于VQE算法,采用了一种称为“分而治之”的策略,设计了分布式VQE算法。通过这种方式,研究人员能够在仅使用10个量子比特的情况下,完成原本需要多达140个量子比特才能解决的任务,显著减少了所需的量子比特数量。当前,基于分布式VQE算法的基因组组装方法已经在模拟器中完成了多个小规模的基因组组装任务,并展现出良好的可扩展性。

此外,研究人员针对基因组装问题的特点,特别设计了一种问题启发式参数化量子线路,以提高算法的性能。在基因组装任务中,需要将测序得到的片段按照正确的顺序拼接起来。由于量子比特能够表示的解的数量远远超过了问题可能的解的总数,这导致了搜索空间的冗余,从而降低了寻找正确解的效率。

华大与量旋科技联合开发长短读长混合组装量子算法,助力量子计算应用研究
图2. 展示了带有重复序列和测序错误的短读长和长读长数据进行编码后放到量子计算机上计算得到表示正确解的量子态并最终解码得到正确的组装序列。

为了解决这个问题,研究人员设计出一种专门的量子线路,成功地减少了需要搜索的解空间(如图2所示)。与通用的硬件高效量子线路相比,这种定制的量子线路能够实现约3倍的收敛速度提升,从而更高效地找到正确的基因组装顺序。

实际上,目前量子算法不仅在生命科学已有应用,同样也能解决物流领域的供应链问题等等。以分布式VQE算法为例,这是一种可以在NISQ时代专门求解大规模QUBO问题的经典-混合量子算法。未来,分布式VQE算法可以应用于更多的领域,如金融领域中用于投资组合优化、期权定价等问题,帮助金融机构提高服务质量、降低风险;在能源领域,用于电力系统的优化、设备调度和可再生能源的集成,从而提高能源效率,减少碳排放。