2022年3月24日,《自然·计算科学》(Nature Computational Science)在线发表了题为“Autonomous inference of complex network dynamics
from incomplete and noisy data”的研究论文,该研究由金沙威尼斯欢乐娱人城、上海自主智能无人系统科学中心严钢教授团队完成。在该研究中,作者提出了数据驱动的复杂系统自主推理新框架,实现了结构信息不完整和强噪声场景下的鲁棒推理,为自动化、智能化地发现真实复杂系统的底层原理提供了重要基础和算法支撑。
复杂系统是由大量节点相互作用所形成的非平凡系统,例如无人集群系统、物联网、神经元网络、社会信息网络等。随着数字化和微观实验技术的不断发展,很多学科领域都积累了关于实际复杂系统的大量观测数据,主要包括网络结构和节点活动序列。从这些观测数据中发现底层原理是科学研究常常需要经历的过程。站在智能化蓬勃兴起的当今,能否利用人工智能辅助的方式加速这种科学发现的过程,比如从数据中自动化地推理出决定复杂系统行为的动态方程,是学界和业界都普遍关心的问题。
以往的研究着重于单节点或少量节点动态方程的推理,对于包含大量节点的复杂网络系统而言这个问题面临更多挑战。例如,不仅节点活动数据含有噪声而且网络结构数据可能不准确,节点的自身动力学可能具有异质性,系统宏观行为可能会掩盖节点之间动态耦合的微观机制。为了克服这些挑战,在该研究中作者融合全局和局部两个视角,提出了新的复杂系统自主推理框架(图1),该算法能够高效、准确地从观测数据中推理出隐藏的网络动力学方程,为自动化地发现复杂系统的底层原理提供了有效的新途径。
该算法框架具有很强的鲁棒性,能够对抗观测数据中的缺失边、伪连边、观测噪声、关联噪声、内禀随机性等不确定性,在宏观行为同步较强时仍然能够实现推理。与以往针对单个体或少量个体的智能推理方法相比,该研究提出的方法能够在更复杂、非正交项空间中进行搜索,而且在针对数据不确定性的5个模型系统测试中均表现更优。该框架也被应用于推理全球性传染病的传播动力学(图2),算法基于H1N1传播数据,发现了用于描述早期传播过程的简洁的常微分方程,该方程同时能够刻画SARS和COVID-19的早期传播行为,验证了方法的有效性和普适性。
该研究由金沙威尼斯欢乐娱人城博士研究生高婷婷(第一作者)和严钢教授(通讯作者)完成,并得到了国家自然科学基金、国家科技创新2030、上海市市级科技重大专项等项目资助。
论文链接:https://www.nature.com/articles/s43588-022-00217-0