剑桥量子发布世界上首个量子自然语言处理软件工具包

企业动态 量科网 2021-10-13 17:18

剑桥量子(Cambridge Quantum)今日宣布,正式发布世界上第一个量子自然语言处理(QNLP)工具包和库。该工具包名为Lambeq,是以已故数学家和语言学家Joachim Lambek的名字命名。它是世界上首个能将句子转换为量子电路的QNLP软件工具包。它旨在加速实用的、真实的QNLP应用程序开发,例如自动对话、文本挖掘、语言翻译、文本到语音、语言生成和生物信息学。

Lambeq已在完全开源的基础上发布,将造福世界量子计算社区以及快速发展的量子计算研究人员、开发人员和用户的生态系统。Lambeq能与剑桥量子的TKET平台无缝协助,TKET是世界领先且发展最快的量子软件开发平台,它也是完全开源的。这为QNLP开发人员提供了访问尽可能广泛的量子计算机的权限。

剑桥量子首席科学家Bob Coecke领导的位于牛津的量子计算研究团队完成了对Lambeq的构思、设计和开发,高级科学家Dimitrios Kartsaklis博士担任该平台的首席架构师。Lambeq和更广泛的QNLP是一个可以追溯到十多年前的研究项目的结果。

Coecke说:“我们的团队一直在参与探索如何使用量子计算机来解决人工智能中一些最棘手问题的基础工作。这项工作基于最初由我、Steve Clark(现在是剑桥量子的人工智能负责人)和其他人开创的进展,NLP是这些研究的核心。Lambeq的发布是继几个月前发表论文后自然的下一步,该论文描述了剑桥量子在实际量子计算机上实现第一个QNLP的详细信息,我们在2019年12月首次披露了它的基本原理。”

Coecke补充道:“在过去一年发表的多篇论文中,我们不仅提供了有关量子计算机如何增强NLP的详细信息,而且还证明了QNLP是‘量子原生’的,这意味着控制语言的组成结构在数学上就像管理量子系统一样。这最终将使世界摆脱当前依赖于不透明和近似蛮力技​​术的人工智能范式。”

Lambeq实现了剑桥量子科学家之前描述的成分分布(DisCo)类型NLP实验的设计和部署,并实现了自动化。这意味着从对文本结构进行编码的语法/语法图转变为了使用TKET实现的(经典)张量网络或量子电路,以便为文本分类等机器学习任务进行优化。它采用模块化设计,用户可以在模型中交换组件,并在架构设计上具有灵活性。

该工具包还消除了专注于人工智能和人机交互从业者和研究人员进入的壁垒,这可能是量子技术最重要的应用之一。TKET已在全球范围内获得了数十万用户群。Lambeq有可能成为量子计算社区寻求参与QNLP应用的最重要工具包,而QNLP应用是人工智能最重要的市场之一。最近变得明朗的一个关键点是,QNLP也将适用于基因组学和蛋白质组学中出现的符号序列分析。

Kartsaklis说:“关于QNLP有很多有趣的理论工作,但理论通常与实践相距甚远。通过Lambeq,我们为研究人员提供了获得QNLP实验方面的实践机会,这是目前完全未开发的领域。这是在量子硬件上实现实用、真实NLP应用的关键一步。”

Lambeq已在GitHub上作为常规Python存储库发布,可在此处获得:https://github.com/CQCL/lambeq。迄今为止,lambeq生成的量子电路已在IBM量子计算机和霍尼韦尔量子解决方案的H系列设备上执行和实现。(编译:Qtech)