突破!PTS 模型:高效发现简洁数学表达式的新方法

Discovering symbolic expressions with parallelized tree search

摘要

本文介绍了一种名为并行树搜索(PTS)的新方法,用于从有限数据中自动高效地发现简洁的数学表达式。通过一系列广泛的实验,证明了 PTS 在方程发现方面的卓越准确性和效率,大大优于最先进的基线模型。

原理

PTS 模型的核心是并行符号回归网络(PSRN),它通过自动识别和重用不同数学表达式树的公共子树来共享评估,避免了冗余计算,并利用基于 GPU 的并行搜索,显著提高了性能。具体来说,PSRN 由多个符号层组成,每个符号层包含一系列数学运算符,用于将浅表达式解析树的计算结果转换为更深层次的结果。通过在 GPU 上并行计算符号层的结果,可以快速计算大量候选表达式的误差张量,从而快速找到最优表达式。

流程

PTS 模型的工作流程如下:

  1. 数据准备:准备包含输入变量和目标变量的数据集。
  2. 模型训练:使用训练数据集训练 PTS 模型,包括 PSRN 和 MCTS。
  3. 表达式发现:使用训练好的 PTS 模型在测试数据集上发现数学表达式。
  4. 结果评估:评估发现的数学表达式的准确性和效率。

应用

PTS 模型在科学研究、工程应用等领域具有广泛的应用前景,例如:

  1. 发现自然规律:从数据中发现简洁、精确、可解释的数学表达式,帮助科学家破译未知系统的潜在意义。
  2. 数据驱动的科学探索:在自然科学和工程应用中,数据驱动的科学探索处于前沿,PTS 模型可以帮助科学家从数据中发现潜在的规律和模式。
  3. 复杂系统建模:PTS 模型可以用于发现复杂系统的数学表达式,如非线性动力学系统,从而更好地理解这些系统的行为和机制。
  4. 优化和控制:PTS 模型可以用于发现优化问题的数学表达式,从而帮助工程师设计更好的控制器和优化系统参数。