双端合成规划:一种新型计算机辅助合成规划算法
摘要
本文介绍了一种名为“双端合成规划(DESP)”的新型计算机辅助合成规划(CASP)算法,该算法通过双向图搜索方案解决了在实际应用中常见的特定起始材料约束问题。DESP算法通过从目标分子和指定的起始材料同时进行扩展,确保了约束条件的满足。该算法利用离线学习的条件成本网络来指导搜索过程,并在多个新的基准测试中展示了其提高解决率和减少搜索扩展数量的能力。DESP能够利用现有的单步逆合成模型,并且随着这些模型能力的提升,其性能有望进一步提高。
原理
DESP算法的核心在于双向搜索和条件成本网络的应用。双向搜索意味着算法同时从目标分子和起始材料两个方向进行搜索,这样可以在两个方向上找到交汇点,从而更有效地规划合成路径。条件成本网络是一个离线学习的模型,它通过分析部分观察到的有效化学反应超图来预测合成路径的成本,从而指导搜索过程向着成本更低的路径发展。这种网络的引入使得DESP能够在考虑特定起始材料约束的同时,优化合成路径的选择。
流程
DESP算法的工作流程包括初始化两个搜索图(一个从目标分子开始,另一个从起始材料开始),然后在这两个图中交替进行逆合成扩展和正合成扩展。在每个扩展步骤中,算法会选择最有希望的前沿节点进行扩展,并更新搜索图。这个过程会一直持续,直到找到满足所有约束条件的合成路径。例如,在一个测试案例中,DESP-F2F能够找到一条合成路径,而Retro*则无法找到,这显示了DESP在处理复杂合成规划问题时的优势。
应用
DESP算法的应用前景广阔,特别是在需要考虑特定起始材料约束的复杂分子合成规划中。随着单步逆合成模型能力的提升,DESP的性能将进一步增强,有望在药物设计、材料科学等领域发挥重要作用。此外,DESP的框架也为未来在更广泛的化学合成问题中应用双向搜索策略提供了可能。
