蛋白质谱进展简报 | 2023年第十一周

View :1303

利用机器学习鉴定Long-COVID血液生物标志物

图源:论文截图

来自加拿大劳森健康研究所Douglas D. Fraser团队发表了利用机器学习鉴定Long-COVID血液生物标志物的研究。
团队首先使用PEA方法测量了2925种血浆蛋白质的表达,然后利用Boruta特征减少算法,筛选出了能够区分长期新冠患者和急性新冠患者以及健康对照组的119种生物标志物。利用RFE对生物标志物进行缩减,得到了两个最优模型,一个包含9种蛋白质,一个包含5种蛋白质。都能以AUC=1的准确率来区分长期新冠患者。随后利用BioNLP13CG生物医学模型,分析这些生物标志物在器官、细胞的表达,发现长期新冠最影响消化系统以及免疫系统。

在本研究种使用了NLP的模型来识别信息,未来若有大规模蛋白质组学的知识图谱,送入蛋白标志物,也许能进一步提取出某个蛋白的的表达部位、其通路以及其复合体。

https://molmed.biomedcentral.com/articles/10.1186/s10020-023-00610-z

评述:李泊成

AlphaPeptStats开源Python软件包

图源:论文截图

Matthias Mann团队3月11号在bioRxiv上发表了名为 AlphaPeptStats: an open-source Python package for automated, scalable and industrial-strength statistical analysis of mass spectrometry-based proteomics 的文章。
这篇文章介绍了一个名为AlphaPeptStats的开源Python软件包,用于自动化、可扩展和工业级别的质谱蛋白质组学统计分析。它提供了一系列强大的统计算法、数据可视化功能和数据预处理步骤。
AlphaPeptStats可以导入多种流行搜索引擎的输出,并配备了一个覆盖98%的严格测试框架。它采用宽松的Apache许可证发布,源代码和一键安装程序在GitHub上免费提供。AlphaPeptStats通过其强大的工具推动蛋白质组学研究,使研究人员能够手动或自动探索复杂数据集以识别有趣的模式和异常值。该软件包包括预处理、统计分析、可视化和基因本体论分析的功能。

该软件包包括从各种蛋白质组学软件导入输出文件的功能,优化归一化方法,并将图形导出为矢量图形。该软件包在非酒精性脂肪肝病数据集上进行了测试,并在使用Quantile归一化时显示出14个显著表达的蛋白质。

https://analyticalsciencejournals.onlinelibrary.wiley.com/doi/10.1002/pmic.201900335

评述:周海洋

空间微量蛋白质组学技术microPOTs

图源:论文截图

美国太平洋西北国家实验室 Paul D Piehowski 团队于2023年03月13日在BioRxiv上发表了 “联合基于微液滴的样品制备、多重同位素标记和纳流肽段分馏技术用于组织微环境的深度蛋白质组分析” 的预印本论文。
作为微量蛋白质组学领域的经典技术 nanoPOTs (nanodroplet processing in one pot for trace samples; https://doi.org/10.1038/s41467-018-03367-w) 的升级版,该论文介绍了microPOTs (microdroplet processing in one pot for trace sample)技术,该技术保留了nanoPOTs的优点的同时,可以不再需要高度定制的样本处理设备,提高了该技术的可及性。
同时,通过使用TMT同位素标记技术以及引入了一个标记大样本量(16倍于其他通道样本量)的carrier通道,并使用纳升级液相系统进行肽段分馏,整套方法显著提高了样本分析的通量,鉴定灵敏度和蛋白质组的鉴定深度。该团队通过该系统可以从激光显微切割的 60,000 µm2人胰腺冷冻切片组织中鉴定到 52,000 个肽段,对应超过 5,500 种蛋白质。

该文章所报道的方法学为空间微量蛋白质组学技术的应用提供了一个较为有效的途径。

https://www.biorxiv.org/content/10.1101/2023.03.13.531822v1
评述:董振

解密药物作用和蛋白质修饰

图源:论文截图

Kuster组用31个药物处理13个肿瘤细胞,收获1,2,4,8,16小时的药物处理样本,基于TMT分析全蛋白质组(超过1w蛋白)、磷酸化蛋白质组(124,660磷酸化多肽)、泛素化蛋白质组(9173泛素化多肽)、乙酰化蛋白质组(2478乙酰化多肽)以及EC50数据。

全文分别对化疗药物、蛋白互作抑制剂、蛋白酶体抑制剂、表观遗传药物、激酶抑制剂、抗体的剂量依赖和时间依赖的蛋白质组和通路的变化进行分析。研究发现化疗药物引起的DNA损伤,识别特定药物的激酶抑制剂的修饰标记,以及证明利妥昔单抗通过过度激活B细胞受体信号杀死CD20阳性B细胞等作用机制。

https://www.science.org/doi/10.1126/science.ade3925
评述:孙瑞

通过验证蛋白互作组发现肿瘤驱动因子

图源:论文截图

这篇文章讨论了蛋白质-蛋白质相互作用(PPI)网络如何帮助识别癌细胞中改变的通路和潜在的治疗靶点。
作者重点介绍了两项使用亲和纯化-质谱(AP-MS)技术检测头颈部鳞状细胞癌(HNSCC)和乳腺癌(BC)中PPI网络的研究,并发现了许多以前未知的癌细胞相互作用。
他们还提到了一项将新的PPI数据与现有的公共数据结合起来,生成一个有结构的蛋白质通路图,以帮助验证这些PPI的研究。作者解释了PPI如何揭示特定的癌症机制,例如突变、相互作用和调节,这些机制驱动着肿瘤生长和转移。他们还建议PPI可以通过识别协同通路和可药物靶点来指导精准治疗。

他们最后强调了需要更多高通量功能测试和分析来进一步挖掘PPI数据并将它们整合成类似行为的通路。

https://www.science.org/doi/10.1126/science.abl9080
评述:杨亮

肺癌筛查综述

图源:论文截图

2022年12月20日,THE LANCET 发表一篇肺癌筛查的综述,包含了肺癌筛查的现状和未来方向。文章中指出肺癌筛查的里程碑事件,其中和低剂量CT相关的有,NLST试验中从美国33个中心的53454名肺癌高危人群随机分配,在2002年至2004年间每年进行三次低剂量CT或胸片筛查。
在低剂量CT组中,与X线组比较,结论:肺癌死亡率相对降低了20.0%。NELSON试验将2003年至2006年间的13195名男性(主要分析)和2594名女性(亚组分析)随机分为两组,分别在基线,1年,3年和5.5年时接受低剂量CT检查,研究结论,10年后的肺癌累积死亡率下降约24%。

综述中提及:肺癌高危人群的定义,肺结节和肺癌;戒烟的干预以及实施肺癌筛查的成本问题。

关于肺癌筛查的未来方向:
01 个性化筛查时间间隔;
02 机器学习,深度学习等人工智能用于肺癌筛查;
03 血液标志物(血浆中miRNA/肺癌自身抗体/循环蛋白生物标志物/循环肿瘤DNA等)的发现可能在完善肺癌筛查的选择标准等方面发挥作用;

04肺癌筛查实施注意事项。

结论:低剂量CT用于肺癌筛查,有助于降低肺癌死亡率。个性化筛查时间间隔,COPD和心血管风险的评估,人工智能和新型生物标志物的进一步研究是提高肺癌筛查的方向。

https://doi.org/10.1016/S0140-6736(22)01694-4
评述:高欢欢

尿病患者多组织样本蛋白组学分析

图源:论文截图

Matthias Mann 团队联合瑞典乌普萨拉大学研究团队 使用三个组别共43人(健康、糖尿病前期、2型糖尿病患者)的多组织样本(内脏脂肪组织 ,肝脏,骨骼肌,胰岛和血清)进行蛋白组学分析(共195个样本)。共鉴定到超过20000种蛋白,不过最终分析各个器官时通过控制NA,仅使用1500-4000种蛋白进行分析。发现了从健康到糖尿病前期再到糖尿病阶段改变的生物过程和途径(如,胰腺中的免疫和脂质相关过程上调)。

此外,他们还对显著富集的通路进行更细致的分析和讨论,包括丙酮酸代谢和TCA循环的生物学途径,肝脏胆固醇生物合成生物学途径,止血的生物学途径 (凝血级联反应) 和补体级联的生物学途径,描绘了这些途径中各个蛋白的上下调情况。

https://doi.org/10.1016/j.xcrm.2022.100763
评述:陆恬

使用单细胞分辨率蛋白组学技术分析人类植入前胚胎发育阶段蛋白表达谱

图源:论文截图

北京大学第三医院乔杰院士等于2023.1月发表了使用单细胞分辨率蛋白组学技术分析人类植入前胚胎发育阶段蛋白表达谱的文章。
在植入前发育阶段,单个细胞的大小从卵母细胞的大约120 µm减小到囊胚中卵裂球的大约15 µm。相应蛋白质的数量从100 ng减少到大约100 pg。他们使用timsTOF Pro和纳升级油-气-液滴(OAD)芯片实现了Single cell proteomics对58个单个卵母细胞或卵裂球样本的分析。在单个卵母细胞中鉴定了大约三千种蛋白质。
在胚胎发育过程中,由于细胞快速分裂和细胞体积减小,囊胚单个细胞中编码蛋白的数量减少到大约一千。每个阶段重复的平均相关系数约为0.7,表明具有良好的重复性。然后他们对不同时期的样本进行差异蛋白分析和通路分析,描绘了植入前发育过程中的通路变化情况。他们还对人类胚胎植入前的从头翻译模式进行了探索。

此外,他们还比较了小鼠的胚胎蛋白质组,进行跨物种的比较,发现了一系列调节该过程的保守蛋白。

https://www.nature.com/articles/s41421-022-00491-2
评述:陆恬

利用机器学习鉴定Long-COVID血液生物标志物

图源:论文截图

来自加拿大劳森健康研究所Douglas D. Fraser团队发表了利用机器学习鉴定Long-COVID血液生物标志物的研究。
团队首先使用PEA方法测量了2925种血浆蛋白质的表达,然后利用Boruta特征减少算法,筛选出了能够区分长期新冠患者和急性新冠患者以及健康对照组的119种生物标志物。利用RFE对生物标志物进行缩减,得到了两个最优模型,一个包含9种蛋白质,一个包含5种蛋白质。都能以AUC=1的准确率来区分长期新冠患者。随后利用BioNLP13CG生物医学模型,分析这些生物标志物在器官、细胞的表达,发现长期新冠最影响消化系统以及免疫系统。

在本研究种使用了NLP的模型来识别信息,未来若有大规模蛋白质组学的知识图谱,送入蛋白标志物,也许能进一步提取出某个蛋白的的表达部位、其通路以及其复合体。

https://molmed.biomedcentral.com/articles/10.1186/s10020-023-00610-z

评述:李泊成

AlphaPeptStats开源Python软件包

图源:论文截图

Matthias Mann团队3月11号在bioRxiv上发表了名为 AlphaPeptStats: an open-source Python package for automated, scalable and industrial-strength statistical analysis of mass spectrometry-based proteomics 的文章。
这篇文章介绍了一个名为AlphaPeptStats的开源Python软件包,用于自动化、可扩展和工业级别的质谱蛋白质组学统计分析。它提供了一系列强大的统计算法、数据可视化功能和数据预处理步骤。
AlphaPeptStats可以导入多种流行搜索引擎的输出,并配备了一个覆盖98%的严格测试框架。它采用宽松的Apache许可证发布,源代码和一键安装程序在GitHub上免费提供。AlphaPeptStats通过其强大的工具推动蛋白质组学研究,使研究人员能够手动或自动探索复杂数据集以识别有趣的模式和异常值。该软件包包括预处理、统计分析、可视化和基因本体论分析的功能。

该软件包包括从各种蛋白质组学软件导入输出文件的功能,优化归一化方法,并将图形导出为矢量图形。该软件包在非酒精性脂肪肝病数据集上进行了测试,并在使用Quantile归一化时显示出14个显著表达的蛋白质。

https://analyticalsciencejournals.onlinelibrary.wiley.com/doi/10.1002/pmic.201900335

评述:周海洋

空间微量蛋白质组学技术microPOTs

图源:论文截图

美国太平洋西北国家实验室 Paul D Piehowski 团队于2023年03月13日在BioRxiv上发表了 “联合基于微液滴的样品制备、多重同位素标记和纳流肽段分馏技术用于组织微环境的深度蛋白质组分析” 的预印本论文。
作为微量蛋白质组学领域的经典技术 nanoPOTs (nanodroplet processing in one pot for trace samples; https://doi.org/10.1038/s41467-018-03367-w) 的升级版,该论文介绍了microPOTs (microdroplet processing in one pot for trace sample)技术,该技术保留了nanoPOTs的优点的同时,可以不再需要高度定制的样本处理设备,提高了该技术的可及性。
同时,通过使用TMT同位素标记技术以及引入了一个标记大样本量(16倍于其他通道样本量)的carrier通道,并使用纳升级液相系统进行肽段分馏,整套方法显著提高了样本分析的通量,鉴定灵敏度和蛋白质组的鉴定深度。该团队通过该系统可以从激光显微切割的 60,000 µm2人胰腺冷冻切片组织中鉴定到 52,000 个肽段,对应超过 5,500 种蛋白质。

该文章所报道的方法学为空间微量蛋白质组学技术的应用提供了一个较为有效的途径。

https://www.biorxiv.org/content/10.1101/2023.03.13.531822v1
评述:董振

解密药物作用和蛋白质修饰

图源:论文截图

Kuster组用31个药物处理13个肿瘤细胞,收获1,2,4,8,16小时的药物处理样本,基于TMT分析全蛋白质组(超过1w蛋白)、磷酸化蛋白质组(124,660磷酸化多肽)、泛素化蛋白质组(9173泛素化多肽)、乙酰化蛋白质组(2478乙酰化多肽)以及EC50数据。

全文分别对化疗药物、蛋白互作抑制剂、蛋白酶体抑制剂、表观遗传药物、激酶抑制剂、抗体的剂量依赖和时间依赖的蛋白质组和通路的变化进行分析。研究发现化疗药物引起的DNA损伤,识别特定药物的激酶抑制剂的修饰标记,以及证明利妥昔单抗通过过度激活B细胞受体信号杀死CD20阳性B细胞等作用机制。

https://www.science.org/doi/10.1126/science.ade3925
评述:孙瑞

通过验证蛋白互作组发现肿瘤驱动因子

图源:论文截图

这篇文章讨论了蛋白质-蛋白质相互作用(PPI)网络如何帮助识别癌细胞中改变的通路和潜在的治疗靶点。
作者重点介绍了两项使用亲和纯化-质谱(AP-MS)技术检测头颈部鳞状细胞癌(HNSCC)和乳腺癌(BC)中PPI网络的研究,并发现了许多以前未知的癌细胞相互作用。
他们还提到了一项将新的PPI数据与现有的公共数据结合起来,生成一个有结构的蛋白质通路图,以帮助验证这些PPI的研究。作者解释了PPI如何揭示特定的癌症机制,例如突变、相互作用和调节,这些机制驱动着肿瘤生长和转移。他们还建议PPI可以通过识别协同通路和可药物靶点来指导精准治疗。

他们最后强调了需要更多高通量功能测试和分析来进一步挖掘PPI数据并将它们整合成类似行为的通路。

https://www.science.org/doi/10.1126/science.abl9080
评述:杨亮

肺癌筛查综述

图源:论文截图

2022年12月20日,THE LANCET 发表一篇肺癌筛查的综述,包含了肺癌筛查的现状和未来方向。文章中指出肺癌筛查的里程碑事件,其中和低剂量CT相关的有,NLST试验中从美国33个中心的53454名肺癌高危人群随机分配,在2002年至2004年间每年进行三次低剂量CT或胸片筛查。
在低剂量CT组中,与X线组比较,结论:肺癌死亡率相对降低了20.0%。NELSON试验将2003年至2006年间的13195名男性(主要分析)和2594名女性(亚组分析)随机分为两组,分别在基线,1年,3年和5.5年时接受低剂量CT检查,研究结论,10年后的肺癌累积死亡率下降约24%。

综述中提及:肺癌高危人群的定义,肺结节和肺癌;戒烟的干预以及实施肺癌筛查的成本问题。

关于肺癌筛查的未来方向:
01 个性化筛查时间间隔;
02 机器学习,深度学习等人工智能用于肺癌筛查;
03 血液标志物(血浆中miRNA/肺癌自身抗体/循环蛋白生物标志物/循环肿瘤DNA等)的发现可能在完善肺癌筛查的选择标准等方面发挥作用;

04肺癌筛查实施注意事项。

结论:低剂量CT用于肺癌筛查,有助于降低肺癌死亡率。个性化筛查时间间隔,COPD和心血管风险的评估,人工智能和新型生物标志物的进一步研究是提高肺癌筛查的方向。

https://doi.org/10.1016/S0140-6736(22)01694-4
评述:高欢欢

尿病患者多组织样本蛋白组学分析

图源:论文截图

Matthias Mann 团队联合瑞典乌普萨拉大学研究团队 使用三个组别共43人(健康、糖尿病前期、2型糖尿病患者)的多组织样本(内脏脂肪组织 ,肝脏,骨骼肌,胰岛和血清)进行蛋白组学分析(共195个样本)。共鉴定到超过20000种蛋白,不过最终分析各个器官时通过控制NA,仅使用1500-4000种蛋白进行分析。发现了从健康到糖尿病前期再到糖尿病阶段改变的生物过程和途径(如,胰腺中的免疫和脂质相关过程上调)。

此外,他们还对显著富集的通路进行更细致的分析和讨论,包括丙酮酸代谢和TCA循环的生物学途径,肝脏胆固醇生物合成生物学途径,止血的生物学途径 (凝血级联反应) 和补体级联的生物学途径,描绘了这些途径中各个蛋白的上下调情况。

https://doi.org/10.1016/j.xcrm.2022.100763
评述:陆恬

使用单细胞分辨率蛋白组学技术分析人类植入前胚胎发育阶段蛋白表达谱

图源:论文截图

北京大学第三医院乔杰院士等于2023.1月发表了使用单细胞分辨率蛋白组学技术分析人类植入前胚胎发育阶段蛋白表达谱的文章。
在植入前发育阶段,单个细胞的大小从卵母细胞的大约120 µm减小到囊胚中卵裂球的大约15 µm。相应蛋白质的数量从100 ng减少到大约100 pg。他们使用timsTOF Pro和纳升级油-气-液滴(OAD)芯片实现了Single cell proteomics对58个单个卵母细胞或卵裂球样本的分析。在单个卵母细胞中鉴定了大约三千种蛋白质。
在胚胎发育过程中,由于细胞快速分裂和细胞体积减小,囊胚单个细胞中编码蛋白的数量减少到大约一千。每个阶段重复的平均相关系数约为0.7,表明具有良好的重复性。然后他们对不同时期的样本进行差异蛋白分析和通路分析,描绘了植入前发育过程中的通路变化情况。他们还对人类胚胎植入前的从头翻译模式进行了探索。

此外,他们还比较了小鼠的胚胎蛋白质组,进行跨物种的比较,发现了一系列调节该过程的保守蛋白。

https://www.nature.com/articles/s41421-022-00491-2
评述:陆恬
问询(英文)

公众号