• 技术文章ARTICLE

    您当前的位置:首页 > 技术文章 > 蛋白质组学开年第一弹——人工智能助力于空间蛋白质组学

    蛋白质组学开年第一弹——人工智能助力于空间蛋白质组学

    发布时间: 2025-02-28  点击次数: 127次

    PLATO——探索空间蛋白质组学的变革性平台。

    中国科学院动物研究所赵方庆冀培丰团队共同合作,融合人工智能算法、微流控和空间蛋白质组学等技术,并提出人工智能驱动的空间蛋白组学分析技术框架——跨组学数据的并行流投影和迁移学习(PLATO, parallel-flow projection and transfer learning across omics data)。这一成果于2025123日在线发表在《cell》杂志。

     

    1. 人工智能驱动的空间蛋白组学分析技术框架——PLATO

    文章亮点

    Ø PLATO可以实现跨整个组织的高分辨率空间蛋白质组学

    Ø 使用质谱法和微流体技术对数千种蛋白质进行空间分析

    Ø 多种组织兼容,从模式生物到人类样本

    Ø 识别人类乳腺癌中不同的肿瘤亚型和失调蛋白

    技术简介——PLATO框架

    PLATO工作流程主要包括平行数据采集和基于人工智能算法的数据分析(图2)。首先进行三个连续的冷冻组织切片开始:中间切片用于通过组织学染色或空间组学(例如,空间转录组学)生成参考组学数据,而第一个和最后一个切片在不同角度进行基于微流体的蛋白质组学分析。每个切片被平行微通道覆盖,在片上消化后,肽被收集用于LC-MS/MS分析。这些测量被称为平行流投影,类似于基于射线的断层扫描。

    为了重建蛋白质的空间分布,研究者开发了Flow2Spatial,这是一种迁移学习算法,利用参考组学数据来训练深度学习模型,用于从平行流预测中预测蛋白质分布。Flow2Spatial并不仅仅依赖于mRNA-蛋白的相关性,而是利用聚类特征和正交投影来推断空间蛋白质模式。

     

    2. PLATO框架的设计与实验验证

    基于PLATO框架的研究成果

    小鼠小脑空间蛋白质组学图谱

    研究者收集了236个组织体素(~100×100×10μm)用于基于激光捕获显微解剖(LCM)的空间蛋白质组学(图3)。除去异常值后,LC-MS/MS分析平均得到1849个蛋白质组。比较PLATOLCM之间的空间蛋白质组时,观察到大脑区域之间有很强的Spearman相关性:分子层(0.89)、颗粒层(0.87)、纤维束(0.82)和侧隐窝(0.74)。这些相关性与同一地区LCM样本中观察到的基线Spearman系数0.80密切匹配。值得注意的是,区域边界(分子层和颗粒层:0.89,颗粒层和纤维束:0.86)也保持了很高的相关性。20个区域富集蛋白的IF染色证实了它们的空间分布与Flow2Spatial重建结果紧密一致。PLATO与相应的LCM样本表现出高表达相关性,确证了Flow2Spatial重建的准确性,这表明PLATO可靠地绘制了蛋白质的解剖位置,具有很高的准确性。

     

    3. 基于PLATO框架的小鼠小脑空间蛋白质组学图谱。

    基于PLATO框架的人乳腺癌空间蛋白质组学图谱

    研究者绘制了一位77岁女性乳腺癌患者的新鲜冷冻乳腺癌样本的空间蛋白质组图谱(图4),该患者被诊断为HER2+ER 70%PRPLATO使用具有70个平行通道的微流控芯片,每个通道宽25 μm,从两个角度识别每个通道约4,000个蛋白质基团。聚类分析显示三个不同的空间聚类:两个肿瘤区域和一个相邻区域,与病理学注释很好地对齐。LCM -蛋白质组分析,收集了145个组织体素(~100×100×10μm。在肿瘤区域平均每体素发现3500个蛋白,明显多于相邻区域。在所有区域(肿瘤1:0.82,肿瘤2:0.85,邻近:0.81),PLATOLCM结果之间观察到高度的Spearman相关性,并且在区域边界(邻近和肿瘤1:0.80,邻近和肿瘤2:0.81)发现类似的强相关性。像素级的比较进一步证实了PLATO的准确性,IF染色也验证了PLATO中四个代表性蛋白的空间分布。研究发现两种肿瘤亚型:肿瘤HER2+, ER−,PR−)和肿瘤2 (HER2+, ER+, PR−)。通过LCM-蛋白质组分析显示出比临床诊断(HER2+, ER 70%, PR−)更高的准确性,因为PLATO显示70%ER表达是两种亚型的复合。此外,与PAM50亚型相关的蛋白在肿瘤1和肿瘤2之间存在差异表达,证实了它们的不同特征。PLATO重建ERBB2提供了比LCM结果更全面的视图,提示肿瘤内潜在的异质性。肿瘤1富含细胞外基质(ECM)蛋白,如纤维蛋白-5 FBLN5)、丝蛋白- a FLNA)、纤维连接蛋白(FN1)、弹性蛋白(ELN)和LAD1,表明肿瘤表型更具侵袭性。相比之下,肿瘤2富含激素信号相关蛋白,如雌激素受体1 (ESR1)(乳腺癌的临床生物标志物)和粘蛋白1 (MUC1)(稳定和激活雌激素受体),突出了其特别的生物学和与雌激素信号传导的关系。

     

    4. 基于PLATO框架的人乳腺癌空间蛋白质组学图谱。

     

    总结

    尽管基于成像和抗体的方法最近取得了进展,但在空间蛋白质组学中,实现整个组织的深度、高分辨率蛋白质图谱仍然是一个重大挑战。PLATO,一个将微流体与深度学习相结合的集成框架,可以在整个组织切片中实现数千种蛋白质的高分辨率映射。我们通过PLATO框架分析小鼠小脑的空间蛋白质组,在一次运行中鉴定了小鼠小脑2564个蛋白质组。将PLATO应用于大鼠绒毛和人类乳腺癌样本,实现了25μm的空间分辨率,并揭示了与疾病状态相关的蛋白质组动力学。该方法揭示了空间上不同的肿瘤亚型,鉴定了关键的失调蛋白,并为肿瘤微环境的复杂性提供了新的见解。