生化与细胞所科研人员运用 “高阶矩展开进行数据重组的降噪方法”预测复杂系统临界状态的新方法

12月9日,国际学术期刊Scientific Reports在线发表了中国科学院上海生命科学研究院生物化学与细胞生物学研究所陈洛南研究组题为“Identifying early-warning signals of critical transitions with strong noise by dynamical network markers”的最新研究成果。该成果展示了通过重组受到大噪声干扰的数据,利用动态网络标志物(即以网络的动态特征作为标志物)对复杂系统动态发展过程中的状态临界迁移进行预警。

基于数据进行复杂系统临界变化的预测一直是生物信息、环境科学、金融学等领域的研究热点,大数据时代的来临更为开发稳定的、有效的、能够标识临界状态的标志物带来了新的手段和可能。然而,现实的复杂系统往往受到外界和内部噪声的干扰,采集到的数据只是真实系统的近似反映。特别当系统受到持续的内外部大噪声干扰的时候,系统状态的临界变化会随机地发生,即,早于确定性系统由于“分岔”现象而引起的状态转换。因此,如何利用受到大噪声干扰的数据,准确预测系统状态发生迁移的临界点,已经成为一个极具科研价值和现实意义的研究热点。然而,尽管在这一方面研究结果很多,但前人的研究成果都集中在解决小噪声下的预警问题,这是由于大噪声不仅使得数据杂乱,而且持续的强烈干扰会使系统非线性性增强,从而导致已知的预测手段失效。

针对受到大噪声干扰的系统和数据,陈洛南研究组开发了一套新的数据处理、分析方法,即,利用高阶矩展开进行数据的重组。具体来说,他们提出利用数据升维的方法把原系统嵌入到高维空间中,把刻画系统的动态变化过程从“变量的动力学”转换成“变量概率分布的动力学”。重组后的数据虽然维度升高,但是可以有效地降低噪声的干扰,使动态网络标志物(DNB: dynamical network biomarker; or DNM: dynamical network marker)适用于大噪声干扰高维数据空间,从而准确捕捉到系统发生状态变化的预警信号。该方法成功应用在包括生物数据,环境科学数据和金融数据等三个实际数据上,成功预警了小鼠肺部急性伤害的临界期,洱海富营养化迁移的临界期,以及雷曼兄弟银行破产前的金融风险期。

该研究得到了中国科学院和国家自然科学基金的经费支持。(生化与细胞所)

Scheme of probability distribution embedding. (a) When the system is under small noise, the critical point of the system is near a bifurcation point of the corresponding deterministic system. (b) When the system is under big noise, the critical transition takes place much earlier than that of the deterministic system due to strong fluctuations. (c) By moment expansion, the state-dynamics under big noise is transformed to the probability distribution-dynamics with much smaller noise but in a higher-dimensional space (e.g., a two-moment-variables system), for which the critical point is near the bifurcation of the reconstructed high-dimensional system. (d-g) The moment-expanding strategy decreases the fluctuation of the data, and thus makes the traditional criteria effective because of the significantly reduced fluctuations.

相关附件
;