交互式符号回归:协同设计机制与离线强化学习解锁科学发现新可能

《Nature Communications》:

【字体: 时间:2025年04月27日 来源:Nature Communications

编辑推荐:

  在符号回归领域,传统在线搜索方法和基于预训练 Transformer 的模型面临表达式组合空间大、难以融合领域专家先验知识等难题。研究人员提出 Symbolic Q-network(Sym-Q)及协同设计机制开展研究。结果显示,Sym-Q 性能优异,协同设计机制提升显著。这为符号回归带来新突破。

  在科学研究的长河中,理解变量之间的数学和物理关系就像一把神奇的钥匙,能帮助我们打开探索未知世界的大门。符号回归(Symbolic Regression)正是这样一种强大的工具,它可以从观测数据中挖掘出隐藏的数学表达式,揭示变量间的内在联系。想象一下,在复杂的天体物理研究中,准确找出不同物理量之间的关系,对于理解宇宙的奥秘至关重要;在工程领域,确定各种参数之间的数学关联,有助于优化设计、提高效率。
然而,符号回归面临着巨大的挑战。随着符号表达式长度的增加,其可能的组合空间呈指数级增长,这使得寻找最优表达式成为一个计算量极大的 NP-hard 问题。就好比在一个庞大无比的迷宫中寻找出口,每走一步都有无数种选择,要找到正确的路径谈何容易。传统的在线搜索方法,如遗传编程(Genetic Programming,GP)和强化学习(Reinforcement Learning,RL),虽然在一定程度上能够探索解决方案空间,但它们往往需要为每个特定表达式训练新模型,计算成本高且泛化能力有限。而基于 Transformer 解码器的模型,虽然利用了大规模数据集进行训练,能够自主生成看似合理的数学表达式,但依赖传统的教师强制(teacher-forcing)训练范式,导致训练和推理之间存在偏差,容易产生错误累积。此外,这些方法大多没有充分考虑领域专家的先验知识,使得模型在面对复杂问题时,难以准确捕捉到真实的物理过程。

为了攻克这些难题,来自瑞士苏黎世联邦理工学院(ETH Zürich)和洛桑联邦理工学院(EPFL)的研究人员展开了深入研究。他们提出了一种创新的方法 ——Symbolic Q-network(Sym-Q),并引入了协同设计机制(co-design mechanism),旨在提升符号回归的性能,更好地融合专家知识。这项研究成果发表在《Nature Communications》上,为符号回归领域带来了新的曙光。

研究人员在开展这项研究时,采用了多种关键技术方法。首先,他们将符号回归问题构建为一个马尔可夫决策过程(Markov Decision Process,MDP),把表达式树的生成看作是一个序列决策任务。在这个过程中,状态由当前表达式树和观测数据定义,动作则是选择数学表达式来填充表达式树的节点,通过使用决定系数(R2)作为奖励指标来衡量动作的有效性。其次,Sym-Q 算法包含三个主要模块:点集编码器、表达式树编码器和 Q 网络,用于处理数据和计算 Q 值。此外,为了解决训练过程中的值估计过高问题,研究人员采用了保守 Q 学习(Conservative Q-learning,CQL)算法,并引入监督对比学习来增强点编码器的性能。

下面让我们详细看看研究结果。

  1. 训练数据集:研究人员基于 100,000 个预定义的表达式框架,生成了 500 万个数学表达式作为训练数据集。这些框架最多包含两个自变量,通过在随机生成的一元 - 二叉树节点中填充运算符,在叶子节点填充自变量或常量,并对常量进行 50 次变化,为每个变化采样 100 个随机数据点得到。
  2. 基准数据集评估:研究重点关注生成准确的表达式框架,为此使用骨架恢复率和 R2作为评估指标。在具有挑战性的 SSDNC 数据集上,Sym-Q 在不使用束搜索时骨架恢复率达到 42.7%,使用束搜索后显著提升至 82.3%,超过了其他基于 Transformer 的监督学习方法,如 SymbolicGPT、Neural Symbolic Regression that Scales(NeSymReS)和 Transformer-based Model for Symbolic Regression via Joint Supervised Learning(T-JSL),并且取得了 0.95135 的优异平均 R2分数。在其他五个公认的基准测试中,Sym-Q 同样表现出色,实现了 0.95044 的加权平均 R2拟合精度。此外,在针对具有三个自变量的模型训练和评估中,Sym-Q 在方程恢复和 R2指标上也优于 NeSymReS,展示了良好的扩展性。
  3. 协同设计机制评估:为验证协同设计机制的有效性,研究人员进行了一系列实验。在使用 SSDNC 数据集的实验中,随着逐步引入领域专家提供的先验知识(即真实决策序列中的更多步骤),Sym-Q 的骨架恢复率显著提高,且提升效果优于 NeSymReS。在 Feynman 数据集的实验中,Sym-Q 利用协同设计机制,在扩展已知方程以解释未建模动力学方面表现出色,能够有效恢复各种类型的漂移项,如加法和乘法指数因子、加法常数和线性项等。在处理合成凌星光谱数据集时,通过引入领域专家的先验知识,Sym-Q 能够逐步优化,最终准确推导出热木星系外行星凌星半径因子 f 的解析表达式。
  4. 代理决策的详细误差分析:通过对 SSDNC 数据集上代理决策过程的逐步分析,发现模型在表达式生成过程的中间阶段错误率最高。这可能是因为初始决策多为简单二元操作,而后期决策因表达式逐渐明确而相对容易。同时,模型错误率与训练数据集中操作的分布密切相关,且常难以确定准确的常数值,容易混淆 sin 与 cos 函数、平方根与幂运算、除法与幂运算等。

研究结论和讨论部分指出,Sym-Q 为大规模符号回归提供了一种先进的范式。它不仅能够从零发现符号表达式,还克服了传统符号回归模型在融合人类先验知识方面的局限性,特别是在面对固定或分布外(out-of-distribution,OOD)方程结构时。协同设计机制使得领域专家能够与模型实时协作,通过提供部分定义的表达式树或先验信息,有效引导模型生成更准确、符合物理规律的数学表达式,增强了表达式的可解释性和科学相关性。Sym-Q 的通用性强,可以与多种编码器结合,避免了教师强制模型中固有的训练 - 测试不匹配问题,泛化能力更好。未来的研究可以朝着处理更复杂类型的表达式(如常微分方程和偏微分方程)、进一步优化协同设计框架以更复杂地融合专家知识,以及扩展模型到更高维空间等方向展开。这项研究成果为符号回归在复杂现实问题中的应用提供了强大的工具,有望推动多个领域的科学研究和工程实践取得新的突破。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号