编辑 | 白菜叶
生命系统中动力学过程的表征为其机械解释和与生物功能的联系提供了重要线索。由于显微镜技术的最新进展,现在可以在生理条件下以多个时空尺度常规记录细胞、细胞器和单个分子的运动。然而,在拥挤和复杂的环境中发生的动态自动分析仍然落后于微观图像序列的获取。
在这里,哥德堡大学的研究人员提出了一个基于几何深度学习的框架,可以在各种生物学相关场景中实现对动力学特性的准确估计。这种深度学习方法依赖于由基于注意力的组件增强的图形神经网络。通过使用几何先验处理对象特征,网络能够执行多项任务,从将坐标链接到轨迹到推断局部和全局动态属性。研究人员通过将这种方法应用于与广泛的生物实验相对应的真实和模拟数据来证明这种方法的灵活性和可靠性。
该研究以「Geometric deep learning reveals the spatiotemporal features of microscopic motion」为题,于 2023 年 1 月 16 日发布在《Nature Machine Intelligence》。
生命系统的生物学功能依赖于响应内源性和外源性刺激而动态变化的相互作用。研究这些系统组件的运动为理解健康和疾病的机械洞察力奠定了基础。
在过去的 20 年里,显微镜技术已经发展到可以以前所未有的时空分辨率监测多尺度动态过程的程度。延时显微镜实验揭示了单细胞生物用于寻找食物或避免不利条件的策略,并有助于了解组织生长和修复、癌症转移、群体感应、多细胞生物的出现和多细胞生物的免疫反应。荧光显微镜监测了纳米级的生物运动,详细描述了细胞环境中单个细胞器和分子的扩散,并揭示了它们在信号和功能调节的基本过程中的作用。
显微镜采集技术的重大改进导致人们付出巨大努力来开发和改进算法,以自动从这些实验中提取定量信息。检测跟踪方法的标准分析流程包括以下步骤:(1) 视频帧被分割(分割)或以其他方式处理以检测和定位感兴趣的对象(检测/定位);(2) 将不同时刻检测到的位置连接成轨迹(linking);(3) 最后分析重建轨迹以量化动力学参数(运动表征)。
前两个步骤通常一起出现并称为跟踪。有几个因素使生物实验的分析变得复杂,例如成像噪声、高物体密度、融合或分裂事件、随机和异质运动以及形状变化的物体。每一步的错误都会沿着管道传播,并最终影响动态信息的提取。
已经提出了许多算法解决方案来解决跟踪算法的局限性,并且已经在开放挑战中比较了它们的性能。然而,这些方法中的大多数都特定于给定的实验或动态模型,并且通常需要手动调整参数。当前的深度学习革命促进了各种跟踪和运动表征方法的发展。
几何深度学习提供了令人信服的方法来从不同的角度处理跟踪和运动表征。它将神经网络推广到可以用数学对象描述的问题,例如对输入结构信息进行编码的图形。基于图的深度学习方法通常称为图神经网络 (GNN),并已成功应用于分子特性预测、药物发现、计算机辅助逆合成和人类轨迹预测等领域。除了在科学中普遍用于表示复杂系统外,图形还提供了一种自然而直观的方式来表示跟踪实验中包含的信息。
图示:使用 MAGIK 的轨迹时空表征。(来源:论文)
在这里,哥德堡大学的研究人员描述了一个通过 GNN Inductive Knowledge (MAGIK) 进行运动分析的框架,它通过延时显微镜提供了对动态特性的准确估计。MAGIK 通过图形表示对系统的运动和交互进行建模。该图通过可解释和自适应的基于注意力的 GNN 进行处理,该 GNN 估计对象之间的关联并提供对系统内在动态的洞察。研究人员通过量化其在与广泛的生物实验相对应的真实和模拟数据上的性能,展示了 MAGIK 的灵活性和可靠性。
图示:使用 MAGIK 的轨迹链接。(来源:论文)
首先,研究人员在各种具有挑战性的实验场景中以其最自然的应用为基准,即轨迹链接。结果表明,即使在高度异构的场景中,MAGIK 也可以在没有显式链接的情况下估计局部和全局动态特性。
这项工作中分析的示例突出了 MAGIK 在不同生物环境中的广泛通用性。值得注意的是,相同的架构可以应用于研究其他可观察量,可以训练以同时估计多个参数,甚至可以用于延时显微镜以外的应用,其中时间由另一个变量代替。
图示:MAGIK 在各种实验场景中可靠地链接轨迹。(来源:论文)
MAGIK 提供了一种关键的支持技术,可以以完全无链接的方式从分割/定位中估计动态参数,而其他方法需要对对象之间的链接有一定程度的了解。因此,它为那些无法可靠地执行轨迹链接的实验提供了一个强大的解决方案,例如,由于高物体密度或探针闪烁。
论文链接:https://www.nature.com/articles/s42256-022-00595-0