NBT|组织特异性蛋白质关联图谱推动候选疾病基因优先排序

View :33

5月2日,瑞士苏黎世联邦理工学院分子系统生物学研究所的 Pedro Beltrao / Bernd Wollscheid / Diederik S. Laman Trip 团队,在 Nature Biotechnology 发表了一篇构建人类组织特异性蛋白质关联图谱的文章。

研究构建了一个涵盖11种人类组织的大规模蛋白质共丰度图谱,用于系统刻画组织特异的蛋白质功能关联,并展示了其在疾病相关候选基因功能排序与机制研究中的应用潜力。

图1 文章截图

01  研究背景与目的

蛋白质–蛋白质相互作用(PPI)是细胞功能的核心基础,其紊乱常与人类疾病密切相关。尽管已有多种高通量手段(如Y2H、AP-MS、cofractionation等)揭示PPI图谱,但这些资源大多忽视组织或细胞类型特异性。

已有研究表明,基于蛋白质共丰度的计算方法在预测功能性关联上优于mRNA共表达,且能反映蛋白复合体稳定性与亚细胞定位等翻译后调控机制。

因此,本研究旨在基于大规模组织样本的蛋白质共丰度,构建跨11种人类组织的蛋白质关联图谱(protein association atlas),以支持组织特异的功能研究及疾病基因优先级排序。


02  研究设计与方法

研究整合了50项人类癌症相关蛋白质组研究的数据,共计7,811份组织样本(5,726肿瘤样本,2,085健康配对组织),覆盖14种组织。在其中近4,000个样本中还配有转录组数据。

研究团队采用Pearson相关系数评估蛋白质共丰度,并借助CORUM数据库中稳定复合体的子单元作为正例,使用逻辑回归将共丰度得分转换为蛋白质关联概率。

在技术验证上,蛋白质共丰度的预测能力(AUC=0.80)优于mRNA共表达(AUC=0.70)与蛋白共分离数据(AUC=0.69)。即使剔除基因表达对蛋白丰度的解释效应,共丰度方法仍保持较高预测性能,表明主要预测能力源于蛋白质层面的调控。

图2 a: 每个组织的肿瘤和健康样本数量;b: 工作流程

03  主要发现

1 构建组织特异性蛋白质关联图谱

研究将不同组织的队列样本进行整合,构建了包含1.16亿对蛋白质在11个组织中的关联得分的图谱。每个组织平均包含5,600万个蛋白对,其中1,000万个为 “可能关联”(得分>0.5),近50万个为 “高置信度关联”(得分>0.8)。这些关联中仅有少数在所有组织中复现,突显组织特异性。

2 组织特异性差异并非由基因表达驱动

虽然蛋白质的丰度与组织特异表达基因相关,但仅有约7%的关联差异可归因于基因表达缺失。超过四分之一(约26%)的关联具有显著组织特异性,这些差异更多反映蛋白质装配、翻译后修饰、亚细胞定位等非转录层面的调控机制。

3 细胞类型特异性与疾病功能模块

以AP2复合体为例,作者发现其与突触蛋白的关联在脑组织中更显著,而与非突触蛋白的关联则在脑中减弱。此外,血液、结肠和肝脏等组织中也识别出与贫血、克罗恩病、肝病等相关的组织特异蛋白互作网络,展示了图谱对疾病上下文相关互作的识别能力。

4 构建性状与细胞结构的关联网络

研究系统评估了GWAS性状、GO定义的细胞组分之间的互作得分,发现核心细胞器(如核糖体、剪接体)关联强且跨组织保守,而突触等组织特异结构在不同组织间的关联高度变异,表明图谱捕捉到了功能模块的组织依赖性。

5 优先排序脑病相关候选基因

以强迫症为例,作者识别出与该性状显著相关的15个脑组织特异性细胞组分,这些组件富集药物靶点、小鼠表型基因及低可信度GWAS基因,优先排序效果显著优于传统方法。该策略也被拓展应用于精神分裂症、抑郁症、自闭症等多种神经疾病。

6 精神分裂症相关蛋白互作网络构建与验证

基于369个GWAS鉴定的精神分裂症相关基因,研究构建了一个组织特异的脑互作网络,并结合AlphaFold2结构建模、pulldown实验验证得到了205个高置信度互作。网络中的许多蛋白互作此前未在数据库中记录,但与已知药物靶点、动物模型数据显著重合,强调了方法在发现新型脑特异互作与功能基因方面的潜力。

7 突触互作网络与疾病基因识别

研究利用共分离与共丰度方法构建了一个覆盖1,600余种蛋白的突触互作网络,并从中识别出与脑疾病相关的727个高可信度互作。结合AlphaFold2结构预测,进一步支持多个具有弱GWAS证据的潜在致病基因(如TOM1L2、ATP2B2、PAFAH1B1)在ADHD、SCZ、抑郁症等疾病中的潜在功能角色。


04  研究意义与展望

本研究构建了一个大规模、具组织特异性的蛋白质关联图谱,涵盖人类主要组织类型。该图谱不仅在方法上验证了蛋白质共丰度作为PPI预测手段的有效性,也在功能应用上展示了其在组织特异互作识别、疾病机制解析、候选基因优先排序等方面的广泛适用性。

与传统聚合型PPI数据库相比,该图谱提供了更加精细化、上下文相关的互作信息,并可与结构预测、功能注释和遗传数据进行整合,为系统生物学与精准医学提供了重要的数据资源与方法框架。


论文链接:
https://www.nature.com/articles/s41587-025-02659-z

 

问询(英文)

公众号