2025年12月5日,西湖大学医学院郭天南团队,联合浙江大学医学院第一附属医院徐鹤云教授等多个团队,在EMBO Molecular Medicine发表最新研究,系统揭示了血小板、红细胞和凝血等污染对血浆蛋白质组分析的影响,并开发出解决方案——高通量OmniProt与自动化开源质控软件“白泽 (Baize) ”,https://www.guomics.com/Baize。
文章来源:

图1 文章截图
01 提纲挈领
基于传统前处理方法联合质谱技术的血液样本蛋白质检测,通常可鉴定出约300至1000种蛋白质。近年来,随着纳米颗粒(nanoparticle, NP)与质谱联用技术的发展,血浆蛋白质组的鉴定数量显著提升。然而在实际研究中发现,即便采用相同的质谱采集与分析流程,不同实验间的蛋白质鉴定数目仍存在显著波动,范围可达2000至8000个不等。是否蛋白质数量越高越好呢?
针对这一重复性与稳定性难题,郭天南团队通过深入分析发现,血小板与红细胞污染是导致血浆中蛋白质鉴定数量异常升高的关键因素。在此基础上,团队系统评估了包括血小板、红细胞及凝血相关污染对基于纳米颗粒的血浆蛋白质组学分析的影响,进一步确认血小板与红细胞污染不仅是造成蛋白质鉴定数目增加的主要原因,也是影响蛋白质定量结果可靠性的重要干扰因素之一。
02 被忽视的“血液污染”
基于纳米颗粒的血浆蛋白质组学技术在提升蛋白鉴定深度方面展现出巨大潜力。然而,可能存在的血小板、红细胞残留或凝血不全等问题是数据异常的潜在根源,这些问题长期被学界忽视。
这些污染不仅会导致蛋白鉴定数量的波动很大,从2000-8000个蛋白质不等,更会严重影响低丰度蛋白的定量准确性,给后续的生物标志物发现和疾病诊断带来严重偏差。
研究团队通过严谨的科学实验,建立了经过全面优化的高通量、高灵敏度血浆蛋白质组学流程OmniProt并开发了开源自动化软件白泽 (Baize) ,实现了对三类血液污染的快速评估;同时构建了覆盖10,109个蛋白组的血浆谱图库,为后续DIA分析提供了数据支撑。

图2 本研究建立了OmniProt前处理流程及白泽 (Baize) 软件评估血浆样本污染程度
03 OmniProt:从纳米颗粒筛选到流程建立
研究团队从源头出发,系统比较了包括实性、介孔、空心介孔及分级孔结构在内的多种二氧化硅纳米颗粒。在肺部疾病患者血浆样本的重复分析中,所有纳米颗粒之间鉴定的蛋白质种类重叠超过80%,且实验重复性良好。最终,直径500 nm的实性纳米颗粒(NP23)被用于后续工作。
确立纳米材料后,团队对血浆稀释、形成蛋白冠、洗脱条件等关键参数进行了系统优化。研究发现,碱性缓冲液(pH 11)显著提高了蛋白与肽段的鉴定数量,分别在原有基础上提升12%与36%。通过扫描电镜观察,该条件下显示出稳定的纳米颗粒结构与蛋白冠。
在确定0.5 mg纳米颗粒用量、30分钟孵育时间的基础上,团队进一步优化了洗涤流程,确定三次洗涤及7000 g离心条件能有效去除软蛋白冠。这些系统性的优化工作为OmniProt流程的标准化奠定了坚实基础,确保其在血浆蛋白质组学应用中保持较好的稳定性与重复性。

图3 不同二氧化硅纳米颗粒扫描电镜图
04 OmniProt对低丰度蛋白的检测性能评估
研究将OmniProt与市面上商品化的Top14高丰度蛋白去除试剂盒(Top14)及传统直接酶解(Neat)方法进行比较。结果证实,OmniProt在蛋白质组与肽段鉴定数量上均表现显著优势:其蛋白鉴定数分别为Top14方法的1.7倍和Neat方法的4.8倍;肽段鉴定数分别为Top14方法的2.6倍和Neat方法的5.7倍。该平台显著增强了对低丰度蛋白质的检测能力。
此外,在人-牛混合样本的交叉物种定量准确性评估实验中,OmniProt在检测蛋白数量优于传统直接酶解方法,定量准确性方面与Neat条件下基本一致。三种条件下的生物学重复之间的变异系数中位数低于20%,证实了该流程的高准确性与高重复性。

图4 牛血浆蛋白质组与人血浆混合实验评估OmniProt的定性和定量准确性
05 构建10,000+蛋白质组的血浆谱图库
为支持精准的定量分析,研究团队利用21种化学特性不同的纳米颗粒对肺部疾病患者的血浆样本进行蛋白质富集,并通过高pH反相色谱将肽段分为30或60个组分,进而进行Astral nDIA分析,共计生成780个DIA数据文件。经过DIA-NN分析,最终建立了包含126,661个肽段离子、对应10,109个蛋白组的血浆谱图库。
该数据库不仅覆盖了人类血浆蛋白质图谱(HPA)中94%的蛋白,还显示出多种NP性能(如电荷、官能团、亲水/疏水性)对蛋白吸附性能差异。功能富集分析表明,这些蛋白涉及信号转导、凋亡、蛋白磷酸化、细胞粘附及先天免疫等多个生物过程,该谱图库包含神经退行性疾病、代谢通路及肿瘤通路的相关蛋白。

图5 利用21种纳米颗粒结合肺部疾病患者的血浆样本建立血浆蛋白质谱图库
06 白泽 (Baize) 软件:智能识别三类血液污染
基于OmniProt流程获取的高质量数据,研究团队首次系统鉴定出三类污染的特异性标志物。针对血小板污染,团队构建了PRP(富血小板血浆)与PPP(贫血小板血浆)的混合梯度样本,通过Mfuzz聚类与相关性分析,筛选出30个与血小板污染程度高度相关的新标志物(Spearman r > 0.92)。这些标志物涵盖了大量血小板功能相关蛋白,并通过12例患者样本验证了其可靠性。
在红细胞污染方面,研究人员设计了红细胞-PPP混合梯度模型,从高相关性( r > 0.98 )蛋白中筛选出30个与红细胞污染相关的新标志物,涵盖血红蛋白、细胞膜骨架及气体转运蛋白,具有明确的生物学特异性。六例患者的稀释梯度实验进一步验证了这些标志物的准确性。
对于凝血相关污染,研究比较了使用三种不同采血管(EDTA、柠檬酸钠、肝素锂)采集的样本,实验发现:尽管蛋白鉴定数目无明显差异,但仅59.2%的蛋白质在三种抗凝剂中同时被检测到。通过筛选上下调显著的蛋白,团队确定了20个与凝血相关的污染标志物(如FGA、FGG、FGB、AGGF1、TFRC),并将其整合为凝血污染评估模型。
基于这些发现,研究团队开发了名为白泽 (Baize) 的网页工具,用于快速评估NP富集血浆样本中的三类关键污染。软件通过计算每类污染标志物信号强度与总蛋白信号之比,生成污染指数。用户只需上传蛋白表达矩阵,白泽 (Baize) 即可自动输出各样本的污染状态。
该工具已免费开放,访问地址为:https://www.guomics.com/Baize

图6 白泽软件

图7 用于评估血小板污染的生物标志物的发现、验证及应用
07 临床验证:助力肺结节良恶性判别
为验证OmniProt和白泽 (Baize) 的实际应用价值,研究团队分析了199例肺结节患者(含良性、早期恶性及6例晚期对照)的血浆样本。所有样本采用OmniProt流程处理后进行Astral质谱仪的nDIA方法采集数据,共鉴定出约4413个蛋白质,实验重复性高。通过白泽 (Baize) 检测,研究团队成功识别出5例存在明显污染的样本,并将其从后续分析中剔除,确保了数据的可靠性。
在获得高质量数据的基础上,研究人员采用8种机器学习算法对良恶性结节进行分类。结果显示,Extra Trees模型在F1分数、准确率、召回率及AUC方面表现最优。该模型最终筛选出与肺癌相关的关键蛋白如FSCN1、PDGF、FCGR3A、HAMP、COL15A1等,表明基于OmniProt和白泽 (Baize) 获得的蛋白组数据具备区分肺癌病理状态的潜力。

图8 OmniProt的在肺癌临床队列中的应用
本研究首次系统阐明了血液成分污染对纳米颗粒蛋白质组学的深远影响。
OmniProt流程通过对纳米颗粒筛选和实验条件的全面优化,实现了高通量、高灵敏度的血浆蛋白质组分析;白泽 (Baize) 软件则通过智能算法,为样本质量评估提供了可靠标准;而高质量谱图库的构建,为领域内的后续研究提供了宝贵资源。
本研究也存在一些局限性,例如所采用的非磁性纳米颗粒依赖多次离心操作,限制了工作流程的自动化程度与临床转化效率。同时,受限于试剂与成本,未能与当前所有主流纳米颗粒方法进行全面平行对比。研究人员指出,还需要独立队列对现有肺癌早筛模型筛选出的蛋白做进一步验证。
西湖大学医学院博士生高欢欢,西湖欧米詹越城、浙江大学医学院附属第一医院医生刘元奇博士为该研究共同第一作者。西湖大学医学院郭天南教授、西湖实验室朱怡研究员、浙江大学医学院附属第一医院徐鹤云教授和苗惠文教授为共同通讯作者。研究得到了四大慢病国家科技重大专项、国家重点研发计划、浙江省“尖兵领雁”研发攻关计划的支持。
2025年12月5日,西湖大学医学院郭天南团队,联合浙江大学医学院第一附属医院徐鹤云教授等多个团队,在EMBO Molecular Medicine发表最新研究,系统揭示了血小板、红细胞和凝血等污染对血浆蛋白质组分析的影响,并开发出解决方案——高通量OmniProt与自动化开源质控软件“白泽 (Baize) ”,https://www.guomics.com/Baize。
文章来源:

图1 文章截图
01 提纲挈领
基于传统前处理方法联合质谱技术的血液样本蛋白质检测,通常可鉴定出约300至1000种蛋白质。近年来,随着纳米颗粒(nanoparticle, NP)与质谱联用技术的发展,血浆蛋白质组的鉴定数量显著提升。然而在实际研究中发现,即便采用相同的质谱采集与分析流程,不同实验间的蛋白质鉴定数目仍存在显著波动,范围可达2000至8000个不等。是否蛋白质数量越高越好呢?
针对这一重复性与稳定性难题,郭天南团队通过深入分析发现,血小板与红细胞污染是导致血浆中蛋白质鉴定数量异常升高的关键因素。在此基础上,团队系统评估了包括血小板、红细胞及凝血相关污染对基于纳米颗粒的血浆蛋白质组学分析的影响,进一步确认血小板与红细胞污染不仅是造成蛋白质鉴定数目增加的主要原因,也是影响蛋白质定量结果可靠性的重要干扰因素之一。
02 被忽视的“血液污染”
基于纳米颗粒的血浆蛋白质组学技术在提升蛋白鉴定深度方面展现出巨大潜力。然而,可能存在的血小板、红细胞残留或凝血不全等问题是数据异常的潜在根源,这些问题长期被学界忽视。
这些污染不仅会导致蛋白鉴定数量的波动很大,从2000-8000个蛋白质不等,更会严重影响低丰度蛋白的定量准确性,给后续的生物标志物发现和疾病诊断带来严重偏差。
研究团队通过严谨的科学实验,建立了经过全面优化的高通量、高灵敏度血浆蛋白质组学流程OmniProt并开发了开源自动化软件白泽 (Baize) ,实现了对三类血液污染的快速评估;同时构建了覆盖10,109个蛋白组的血浆谱图库,为后续DIA分析提供了数据支撑。

图2 本研究建立了OmniProt前处理流程及白泽 (Baize) 软件评估血浆样本污染程度
03 OmniProt:从纳米颗粒筛选到流程建立
研究团队从源头出发,系统比较了包括实性、介孔、空心介孔及分级孔结构在内的多种二氧化硅纳米颗粒。在肺部疾病患者血浆样本的重复分析中,所有纳米颗粒之间鉴定的蛋白质种类重叠超过80%,且实验重复性良好。最终,直径500 nm的实性纳米颗粒(NP23)被用于后续工作。
确立纳米材料后,团队对血浆稀释、形成蛋白冠、洗脱条件等关键参数进行了系统优化。研究发现,碱性缓冲液(pH 11)显著提高了蛋白与肽段的鉴定数量,分别在原有基础上提升12%与36%。通过扫描电镜观察,该条件下显示出稳定的纳米颗粒结构与蛋白冠。
在确定0.5 mg纳米颗粒用量、30分钟孵育时间的基础上,团队进一步优化了洗涤流程,确定三次洗涤及7000 g离心条件能有效去除软蛋白冠。这些系统性的优化工作为OmniProt流程的标准化奠定了坚实基础,确保其在血浆蛋白质组学应用中保持较好的稳定性与重复性。

图3 不同二氧化硅纳米颗粒扫描电镜图
04 OmniProt对低丰度蛋白的检测性能评估
研究将OmniProt与市面上商品化的Top14高丰度蛋白去除试剂盒(Top14)及传统直接酶解(Neat)方法进行比较。结果证实,OmniProt在蛋白质组与肽段鉴定数量上均表现显著优势:其蛋白鉴定数分别为Top14方法的1.7倍和Neat方法的4.8倍;肽段鉴定数分别为Top14方法的2.6倍和Neat方法的5.7倍。该平台显著增强了对低丰度蛋白质的检测能力。
此外,在人-牛混合样本的交叉物种定量准确性评估实验中,OmniProt在检测蛋白数量优于传统直接酶解方法,定量准确性方面与Neat条件下基本一致。三种条件下的生物学重复之间的变异系数中位数低于20%,证实了该流程的高准确性与高重复性。

图4 牛血浆蛋白质组与人血浆混合实验评估OmniProt的定性和定量准确性
05 构建10,000+蛋白质组的血浆谱图库
为支持精准的定量分析,研究团队利用21种化学特性不同的纳米颗粒对肺部疾病患者的血浆样本进行蛋白质富集,并通过高pH反相色谱将肽段分为30或60个组分,进而进行Astral nDIA分析,共计生成780个DIA数据文件。经过DIA-NN分析,最终建立了包含126,661个肽段离子、对应10,109个蛋白组的血浆谱图库。
该数据库不仅覆盖了人类血浆蛋白质图谱(HPA)中94%的蛋白,还显示出多种NP性能(如电荷、官能团、亲水/疏水性)对蛋白吸附性能差异。功能富集分析表明,这些蛋白涉及信号转导、凋亡、蛋白磷酸化、细胞粘附及先天免疫等多个生物过程,该谱图库包含神经退行性疾病、代谢通路及肿瘤通路的相关蛋白。

图5 利用21种纳米颗粒结合肺部疾病患者的血浆样本建立血浆蛋白质谱图库
06 白泽 (Baize) 软件:智能识别三类血液污染
基于OmniProt流程获取的高质量数据,研究团队首次系统鉴定出三类污染的特异性标志物。针对血小板污染,团队构建了PRP(富血小板血浆)与PPP(贫血小板血浆)的混合梯度样本,通过Mfuzz聚类与相关性分析,筛选出30个与血小板污染程度高度相关的新标志物(Spearman r > 0.92)。这些标志物涵盖了大量血小板功能相关蛋白,并通过12例患者样本验证了其可靠性。
在红细胞污染方面,研究人员设计了红细胞-PPP混合梯度模型,从高相关性( r > 0.98 )蛋白中筛选出30个与红细胞污染相关的新标志物,涵盖血红蛋白、细胞膜骨架及气体转运蛋白,具有明确的生物学特异性。六例患者的稀释梯度实验进一步验证了这些标志物的准确性。
对于凝血相关污染,研究比较了使用三种不同采血管(EDTA、柠檬酸钠、肝素锂)采集的样本,实验发现:尽管蛋白鉴定数目无明显差异,但仅59.2%的蛋白质在三种抗凝剂中同时被检测到。通过筛选上下调显著的蛋白,团队确定了20个与凝血相关的污染标志物(如FGA、FGG、FGB、AGGF1、TFRC),并将其整合为凝血污染评估模型。
基于这些发现,研究团队开发了名为白泽 (Baize) 的网页工具,用于快速评估NP富集血浆样本中的三类关键污染。软件通过计算每类污染标志物信号强度与总蛋白信号之比,生成污染指数。用户只需上传蛋白表达矩阵,白泽 (Baize) 即可自动输出各样本的污染状态。
该工具已免费开放,访问地址为:https://www.guomics.com/Baize

图6 白泽软件

图7 用于评估血小板污染的生物标志物的发现、验证及应用
07 临床验证:助力肺结节良恶性判别
为验证OmniProt和白泽 (Baize) 的实际应用价值,研究团队分析了199例肺结节患者(含良性、早期恶性及6例晚期对照)的血浆样本。所有样本采用OmniProt流程处理后进行Astral质谱仪的nDIA方法采集数据,共鉴定出约4413个蛋白质,实验重复性高。通过白泽 (Baize) 检测,研究团队成功识别出5例存在明显污染的样本,并将其从后续分析中剔除,确保了数据的可靠性。
在获得高质量数据的基础上,研究人员采用8种机器学习算法对良恶性结节进行分类。结果显示,Extra Trees模型在F1分数、准确率、召回率及AUC方面表现最优。该模型最终筛选出与肺癌相关的关键蛋白如FSCN1、PDGF、FCGR3A、HAMP、COL15A1等,表明基于OmniProt和白泽 (Baize) 获得的蛋白组数据具备区分肺癌病理状态的潜力。

图8 OmniProt的在肺癌临床队列中的应用
本研究首次系统阐明了血液成分污染对纳米颗粒蛋白质组学的深远影响。
OmniProt流程通过对纳米颗粒筛选和实验条件的全面优化,实现了高通量、高灵敏度的血浆蛋白质组分析;白泽 (Baize) 软件则通过智能算法,为样本质量评估提供了可靠标准;而高质量谱图库的构建,为领域内的后续研究提供了宝贵资源。
本研究也存在一些局限性,例如所采用的非磁性纳米颗粒依赖多次离心操作,限制了工作流程的自动化程度与临床转化效率。同时,受限于试剂与成本,未能与当前所有主流纳米颗粒方法进行全面平行对比。研究人员指出,还需要独立队列对现有肺癌早筛模型筛选出的蛋白做进一步验证。
西湖大学医学院博士生高欢欢,西湖欧米詹越城、浙江大学医学院附属第一医院医生刘元奇博士为该研究共同第一作者。西湖大学医学院郭天南教授、西湖实验室朱怡研究员、浙江大学医学院附属第一医院徐鹤云教授和苗惠文教授为共同通讯作者。研究得到了四大慢病国家科技重大专项、国家重点研发计划、浙江省“尖兵领雁”研发攻关计划的支持。
