NBT评论文章|虚拟细胞:预测性免疫治疗的未来

阅读量 :10

      4月14日,马里兰大学医学院 Elana J. Fertig、Daniel R. Bergman 团队在 Nature Biotechnology 发表了评论文章 Virtual cells for predictive immunotherapy探讨了将AI与数学建模结合在免疫治疗中的应用前景,强调二者各有所长且可互补。

      文章指出,AI擅长从大数据中提取模式,而数学模型基于机制理解能提供可解释性。通过整合这两种方法,可构建 “虚拟细胞”(virtual cell) “数字孪生”(digital twin)系统,实现对患者治疗反应的个性化预测,从而推动精准、可控的免疫治疗发展。

下面是该评论文章的全文编译。

将人工智能(AI)的进展与数学建模相结合,将提升我们通过计算预测免疫治疗结果的能力。

AI与计算方法成为免疫治疗研究支柱的时代已经到来。

数字化数据(包括电子病历)使得我们可以利用真实世界的数据开发 “数字孪生” 策略,以推断哪些患者群体最可能从特定治疗中获益。高通量测量技术的数据分析方法有助于发现导致免疫检查点抑制剂反应或耐药的细胞通路。将机器学习方法应用于测序或蛋白质组数据集,可以识别疫苗和细胞疗法的新靶点,以增强免疫治疗反应,甚至可能开发出拦截策略,防止癌症的发生。

此外,AlphaFold2 等方法正揭示免疫治疗耐药机制中所需靶向的蛋白质结构,其应用范围远超癌症免疫治疗,广泛影响整个生物医学研究领域,这一进展也在去年获得了诺贝尔奖的认可。

本文概述了基础计算科学的进展如何为新一代预测医学奠定基础。在这种模式下,我们可以像结合大气测量和计算模型预测天气一样,通过输入患者数据来预测肿瘤在不同疗法下的发展趋势。与天气不同的是,医学领域可以通过设计治疗方案来控制结果,从而防止肿瘤的预测性进展,改善患者预后。

科幻作品为医疗计算方法增添了一丝神秘色彩。而 “体外” 预测医学(predictive medicine)方法更是因其貌似 “数学魔法” 般的复杂性而显得晦涩难懂,这些方法将系统以方程或高维数据的形式进行表示。

然而,每种方法其实都只由三大基本组成部分构成:① 用于训练方法的数据集,② 使数据得以解释的模型方程,③ 将这些方程应用于新输入数据以根据训练集中的概率条件推断结果的软件。预测医学就是将这些部分依次连接,形成一个能够解释各类数据直到做出治疗决策的完整流程。

尽管这一流程看似可以自动化,但技术伪影( technical artifacts)、数学假设与数据结构的不匹配,以及代码中的简单拼写错误,都可能干扰算法的效果。因此,必须确保分析流程中的每一环节都得到充分优化与错误检查。在保护患者隐私的前提下,将训练数据集和计算代码完全公开可以让更多研究者进行审查,以确保其准确性。

因此,开放科学与可重复研究已成为数据驱动生物医学研究的伦理基本准则。这一点也促使计算方法开发和软件基础设施从工程与计算机科学扩展成为医学领域的基础科学研究课题,亟需予以支持。

同样重要的是训练数据本身,因为这些算法只能预测它们 “见过” 的患者结果。因此,训练数据必须充分代表各类患者群体,才能确保预测性免疫治疗的公平性。

计算科学横跨数学、统计学、计算机科学与物理等多个学科,正如癌症治疗需要肿瘤科医生、外科医生、病理学家与放射科医生等多学科协作。在这些学科中,AI是当前生物医学研究中最为突出的计算方法。

尽管AI技术已存在数十年,但生物医学数据数字化的迅速发展与计算基础设施的提升使其在医疗中的应用迅速扩展。

简而言之,AI利用机器学习工具识别大规模训练数据中的模式,并据此对新数据点进行推断。深度学习通过神经网络在多个层级上学习模式,从而进一步提升推断准确性。然而,这些方法需要极其庞大的训练数据集才能避免因过度拟合(overfitting)而产生不准确的结果。

另一个限制是其 “黑箱”(black-box)性质——有时模型能有效预测,却无法解释其预测依据,甚至可能基于错误原因。为此,研究者开发了 “可解释AI”(Interpretable AI)方法,选择可被人类理解的特征以增强透明性,但这些方法仍然严重依赖庞大且具代表性的训练集。

相比之下,数学建模为结果预测提供了另一种选择。

这些模型并非完全依赖数据学习模式,而是用一组方程来表示系统的内在机制。我们可以将数据驱动的AI与机制建模的区别类比为:前者是拟合一个抛物线以追踪球的运动轨迹,后者则是利用重力定律计算球的下落速度。

因此,尽管AI与数学模型都能将输入与结果联系起来,但它们构建预测能力的方式截然不同,从而决定了其适用场景的差异。AI模型结构通用,由训练数据决定其任务形态;数学模型则是针对具体问题而定制的结构,再通过数据加以训练和修正。

这一差异带来两大影响:首先,AI模型通常无法解释为何会做出某种预测,而机制模型则可追踪具体的生物机制以解释输出结果;其次,AI模型在功能上完全受限于数据,而数学模型则结合了领域知识与数据。肿瘤微环境中免疫调控网络的生物基础,加上单细胞数据的加入,使得机制性数学模型可成为替代AI的癌症免疫治疗工具。

如同AI模型有多种形式,数学模型亦有不同种类,在应用于癌症生物学时各具优劣。其中一类是基于代理的模型(ABM),它将单个细胞作为虚拟“代理”进行建模,每个代理依据规则与环境和其他代理互动。每个虚拟细胞可模拟真实肿瘤中的免疫或癌细胞,使ABM特别适合模拟肿瘤微环境随时间的变化。

我们可以通过数学方程表示这些虚拟细胞,以模拟真实生物学行为,为理解和预测免疫治疗干预后的细胞变化提供强大平台。将这些模型与单细胞和空间分子数据结合,更可模拟细胞状态对治疗的响应关系。

尽管AI通常用于利用这些数据预测治疗结果,ABM的细胞级模拟则能够预测肿瘤微环境中细胞状态随时间的演变。建模者甚至可以创建大规模的“虚拟临床试验”,以研究各种治疗组合和患者群体的疗效,从而在实验室或真实临床试验中无法实现的规模上探索治疗效果。

要实现这一转化目标,仍需进一步研究以使ABM更好地模拟人类肿瘤微环境,并通过验证性人群进一步评估模型的准确性,从而发现有前景的治疗组合、预测生物标志物,或提出个性化治疗建议。

预测性免疫治疗的未来离不开数学建模与人工智能的协同作用。虽然机器学习在基础研究与临床转化中均已有诸多成功应用,数学建模有望进一步推动诸如 “数字孪生医学” 等前沿实践,不容小觑。二者各自的潜力固然巨大,但协同的价值更为显著——而这种协同已经开始实践。

对于数学模型而言,AI提供了新的数据流用于模型初始化和校准,提升计算效率,并助力结果分析;而对于AI来说,数学建模提供了跳出数据限制、解释模型预测、探索变量扰动效应以及预测未知数据情形的出口。

在计算免疫治疗中,数据常常稀缺,难以支撑构建足够健壮的个性化AI模型。通过将AI与数学建模相结合,例如在病理切片中提取特征,再将已嵌入领域知识与实验验证的 “虚拟细胞” (virtual cell)置入 “虚拟组织” (virtual tissue)中,我们就能更好地模拟个体肿瘤的特征,从而推动个性化治疗的实现。

论文链接:
https://www.nature.com/articles/s41587-025-02583-2

 

问询(中文)

公众号