Nature Medicine|血浆蛋白质组学揭示ALS早期诊断新希望

阅读量 :132
肌萎缩侧索硬化症(ALS)是一种致命的神经退行性疾病,其早期诊断一直是医学领域的一个重大挑战。最近,一项研究通过血浆蛋白质组学分析,探索了新的生物标志物,并通过机器学习技术建立了一个高准确度的预测模型,为ALS的早期诊断和临床干预提供了新的方向。
这篇题为A plasma proteomics-based candidate biomarker panel predictive of amyotrophic lateral sclerosis的文章,于2025年8月19日在Nature Medicine期刊上发表。
ALS的确诊常常滞后,患者在出现明显症状之前可能已经历了很长一段时间的神经系统变化。当前诊断主要依赖神经影像学和临床评估,缺乏有效的生物标志物。为了填补这一空白,研究团队通过血浆蛋白质组学技术对ALS患者的血浆样本进行了深入分析,并且使用机器学习模型开发出了一个准确度达到98.3%的ALS诊断工具。
本文的研究者们选取了多组不同的样本,包括183例ALS患者、172例健康对照组以及137例其他神经系统疾病患者。使用Olink Explore 3072平台对血浆样本中的蛋白质进行定量分析。通过差异蛋白分析,识别出33种与ALS相关的血浆蛋白。这些蛋白质的差异表达能够有效区分ALS患者与其他神经系统疾病或健康个体。

图2 Study workflow.

 01 

蛋白质标志物的发现

研究通过高通量的血浆蛋白质组学分析,成功识别出33种在ALS患者血浆中表达显著变化的蛋白质。这些蛋白质的差异表达能够有效地区分ALS患者与健康个体及其他神经系统疾病患者(如帕金森病、多发性硬化等)。
其中,神经丝蛋白轻链(NEFL)是已知的ALS生物标志物,研究进一步验证了其在ALS中的升高趋势,证明了其作为ALS早期诊断标志物的潜力。除此之外,其他32种蛋白质并未在前期的研究中被明确与ALS相关,这一发现极大拓宽了对ALS分子机制的理解,特别是在神经退行性病变过程中蛋白质的变化及其可能的生物学作用。

图3 Differential abundance of plasma proteins in patients diagnosed with ALS compared with control individuals.

 02 

机器学习模型的应用与构建

研究团队利用上述发现的33种差异表达的蛋白质数据,以及临床患者的其他参数(如年龄、性别等),运用了机器学习方法建立了一个预测ALS的模型。这个模型使用了不同的算法,最终通过随机森林算法取得了最佳结果。该模型在发现集和验证集上的准确度分别达到了96.2%和98.3%。更重要的是,这个模型的预测准确度并不完全依赖于单一的蛋白质(如NEFL),而是通过综合分析17个重要蛋白质和临床参数,体现了机器学习在复杂生物标志物识别中的强大优势。

图4 Supervised machine learning to diagnose ALS based on plasma proteins.

 03 

病前期的生物标志物

本研究的一个突破性发现是,血浆蛋白质组学的变化可能在ALS症状出现前长达10年甚至更久。研究人员通过分析来自UK Biobank的无症状个体(即尚未出现ALS明显临床症状但未来会发病的人群)血浆样本,发现早期的蛋白质变化与后期ALS症状的出现有着显著的相关性。特别是,血浆蛋白质组学评分(ALS风险评分)在症状出现前的时间点逐渐升高,提示病变进程远早于症状的显现。这一发现为早期诊断和预防治疗提供了可能的方向,尤其是对于无症状的个体,可以通过血浆标志物进行早期筛查。
根据ALS风险评分,研究团队建立了一种能够在症状出现之前预测ALS发病年龄的回归模型。通过这种回归分析,研究发现ALS风险评分在无症状个体中的升高趋势非常明显,并且这种变化与年龄、性别等因素无关。这表明,ALS的发生早在临床症状出现之前,可能就已经在分子水平上有所征兆。尤其是“神经丝蛋白轻链(NEFL)”在无症状个体中的变化,提示这一蛋白质可能在ALS的早期阶段就成为重要的标志物,提供了疾病早期干预的新机遇。

图5 Regression analysis of ALS risk score derived from supervised machine learning predicts the age of ALS onset in asymptomatic patients.

 04 

ALS与C9orf72扩展的关系

研究还探讨了C9orf72基因扩展对ALS蛋白质变化的影响。通过比较携带C9orf72扩展的ALS患者和不携带扩展的患者,研究发现有八种蛋白质在C9orf72扩展的患者中明显升高,这些蛋白质的变化可能与C9orf72扩展的致病机制相关。

图6 Differential abundance of plasma proteins in ALS patients with C9orf72expansions.

 05 

小结

本研究的成功不仅为ALS提供了一种新的血浆生物标志物面板,还揭示了ALS发生的早期分子机制。通过机器学习分析,研究人员能够预测个体何时可能出现症状,这为预防性治疗和临床试验的设计提供了重要参考。特别是在没有明显症状的情况下,能够通过血浆蛋白质组学分析来早期识别疾病,为患者提供及时的治疗和干预。
这一发现不仅为ALS的临床诊断和治疗提供了新的思路,也为其他神经退行性疾病的早期诊断研究奠定了基础。
参考文献:https://www.nature.com/articles/s41591-025-03890-6#Sec14
肌萎缩侧索硬化症(ALS)是一种致命的神经退行性疾病,其早期诊断一直是医学领域的一个重大挑战。最近,一项研究通过血浆蛋白质组学分析,探索了新的生物标志物,并通过机器学习技术建立了一个高准确度的预测模型,为ALS的早期诊断和临床干预提供了新的方向。
这篇题为A plasma proteomics-based candidate biomarker panel predictive of amyotrophic lateral sclerosis的文章,于2025年8月19日在Nature Medicine期刊上发表。
ALS的确诊常常滞后,患者在出现明显症状之前可能已经历了很长一段时间的神经系统变化。当前诊断主要依赖神经影像学和临床评估,缺乏有效的生物标志物。为了填补这一空白,研究团队通过血浆蛋白质组学技术对ALS患者的血浆样本进行了深入分析,并且使用机器学习模型开发出了一个准确度达到98.3%的ALS诊断工具。
本文的研究者们选取了多组不同的样本,包括183例ALS患者、172例健康对照组以及137例其他神经系统疾病患者。使用Olink Explore 3072平台对血浆样本中的蛋白质进行定量分析。通过差异蛋白分析,识别出33种与ALS相关的血浆蛋白。这些蛋白质的差异表达能够有效区分ALS患者与其他神经系统疾病或健康个体。

图2 Study workflow.

 01 

蛋白质标志物的发现

研究通过高通量的血浆蛋白质组学分析,成功识别出33种在ALS患者血浆中表达显著变化的蛋白质。这些蛋白质的差异表达能够有效地区分ALS患者与健康个体及其他神经系统疾病患者(如帕金森病、多发性硬化等)。
其中,神经丝蛋白轻链(NEFL)是已知的ALS生物标志物,研究进一步验证了其在ALS中的升高趋势,证明了其作为ALS早期诊断标志物的潜力。除此之外,其他32种蛋白质并未在前期的研究中被明确与ALS相关,这一发现极大拓宽了对ALS分子机制的理解,特别是在神经退行性病变过程中蛋白质的变化及其可能的生物学作用。

图3 Differential abundance of plasma proteins in patients diagnosed with ALS compared with control individuals.

 02 

机器学习模型的应用与构建

研究团队利用上述发现的33种差异表达的蛋白质数据,以及临床患者的其他参数(如年龄、性别等),运用了机器学习方法建立了一个预测ALS的模型。这个模型使用了不同的算法,最终通过随机森林算法取得了最佳结果。该模型在发现集和验证集上的准确度分别达到了96.2%和98.3%。更重要的是,这个模型的预测准确度并不完全依赖于单一的蛋白质(如NEFL),而是通过综合分析17个重要蛋白质和临床参数,体现了机器学习在复杂生物标志物识别中的强大优势。

图4 Supervised machine learning to diagnose ALS based on plasma proteins.

 03 

病前期的生物标志物

本研究的一个突破性发现是,血浆蛋白质组学的变化可能在ALS症状出现前长达10年甚至更久。研究人员通过分析来自UK Biobank的无症状个体(即尚未出现ALS明显临床症状但未来会发病的人群)血浆样本,发现早期的蛋白质变化与后期ALS症状的出现有着显著的相关性。特别是,血浆蛋白质组学评分(ALS风险评分)在症状出现前的时间点逐渐升高,提示病变进程远早于症状的显现。这一发现为早期诊断和预防治疗提供了可能的方向,尤其是对于无症状的个体,可以通过血浆标志物进行早期筛查。
根据ALS风险评分,研究团队建立了一种能够在症状出现之前预测ALS发病年龄的回归模型。通过这种回归分析,研究发现ALS风险评分在无症状个体中的升高趋势非常明显,并且这种变化与年龄、性别等因素无关。这表明,ALS的发生早在临床症状出现之前,可能就已经在分子水平上有所征兆。尤其是“神经丝蛋白轻链(NEFL)”在无症状个体中的变化,提示这一蛋白质可能在ALS的早期阶段就成为重要的标志物,提供了疾病早期干预的新机遇。

图5 Regression analysis of ALS risk score derived from supervised machine learning predicts the age of ALS onset in asymptomatic patients.

 04 

ALS与C9orf72扩展的关系

研究还探讨了C9orf72基因扩展对ALS蛋白质变化的影响。通过比较携带C9orf72扩展的ALS患者和不携带扩展的患者,研究发现有八种蛋白质在C9orf72扩展的患者中明显升高,这些蛋白质的变化可能与C9orf72扩展的致病机制相关。

图6 Differential abundance of plasma proteins in ALS patients with C9orf72expansions.

 05 

小结

本研究的成功不仅为ALS提供了一种新的血浆生物标志物面板,还揭示了ALS发生的早期分子机制。通过机器学习分析,研究人员能够预测个体何时可能出现症状,这为预防性治疗和临床试验的设计提供了重要参考。特别是在没有明显症状的情况下,能够通过血浆蛋白质组学分析来早期识别疾病,为患者提供及时的治疗和干预。
这一发现不仅为ALS的临床诊断和治疗提供了新的思路,也为其他神经退行性疾病的早期诊断研究奠定了基础。
参考文献:https://www.nature.com/articles/s41591-025-03890-6#Sec14
问询(中文)

公众号