中国学者通过空间转录组空间位置和病理学图像信息,解决空间转录组基因表达谱数据噪音问题
随着技术的进步,空间转录组(spatial transcriptomics)成为近年来通量测序技术中的“香饽饽”。
其原因在于空间转录组功能上的“一举多得”,它不仅能提供基因表达谱数据(近似于单细胞测序数据),还可提供测序的位置信息,甚至对应的病理学图像数据也因其可见。
然而,空间转录组技术(尤其是在高分辨率空间转录组技术)的基因表达谱数据并不能“拿来就用”,其中还存在着大量噪音。
它们或从低通量测序深度(位于每个测序位点)而来,或来自那些为保存测序位置而实施的额外实验步骤。这些噪音在研究者们从空间转录组数据提取出有价值的信息时,形成了天然的障碍。
为修正空间转录组基因表达谱数据中的噪音,近日,美国德州大学西南医学中心与德州大学阿灵顿分校团队合作,发明了一种被称为“Sprod”的方法。他们利用空间位置以及病理学图像的信息,来解决上述问题。
图丨相关论文(来源:Nature Methods)
该论文的共同第一作者为德州大学西南医学中心定量生物学研究中心数据科学家王允冠博士、博士后研究员宋冰,论文共同通讯作者为德州大学西南医学中心定量生物学研究中心王涛助理教授、德州大学阿灵顿分校王莉教授。该论文的其他主要作者还包括西南医学中心谢阳教授、肖光华教授、王诗丹助理教授。
审稿人对该论文评价道: “随着空间测序技术的普及,开发能够有效处理和分析此类数据集的工具非常重要。Sprod 是一种朝着正确方向发展的新方法。利用空间信息和关系,对空间转录组基因表达谱数据降噪尤其具有吸引力。”
该团队在空间转录组数据中发现,在其病理学图像和总体转录谱中,如果位点之间相似并测序位置相邻,则其基因转录谱会相似。并且,这种转录谱相似度与位点间的相似程度成正比。
基于该原理,研究人员使用 Sprod 建立了隐图模型,利用对不同测序位点的空间距离以及基因表达谱特征的分析,将测序位点放入到隐图中。空间转录组的表达谱信息以该隐图为依据流动,从而实现了表达谱数据的降噪。
谈及该方法的应用,王允冠表示,“Sprod 可在各类的空间转录组技术中广泛使用,例如 Visium、Slide-Seq、HDST、Seq-Scope 等。分辨率与表达谱数据噪音成正比,即技术类型分辨率高其噪音也越大,因此 Sprod 也在其中发挥更大的价值。”
该团队首先在模拟数据(simulation data)上对 Sprod 的准确性进行了验证。
在检验数据集上,研究人员生成了一个类似空间转录组数据的并且人为加入了噪音的数据。在应用了 Sprod 之后他们发现,在不同的噪音水平上,Sprod 至少去除掉了 85% 的噪音。
“验证获得了满意的结果之后,我们优化了参数,最后把算法在来自各种空间转录组技术的数据集上进行验证和应用。”王允冠说。
该论文重点在于 Sprod 在真实数据上的应用。研究人员测试了包括 Visium、Slide-Seq、HDST 和 Seq-Scope 等多个平台的数据,发现 sprod 可以在数据降噪的基础上,增强差异表达分析的可靠性,并且使下游的拟时和细胞通讯分析可以更加真实的反应相应的生物学信息。
王允冠认为,正如 2014 年之后单细胞测序技术和应用“井喷式”的发展一样,在未来若干年,空间转录组技术会是热门技术。
他说:“Sprod 具有很强的通用性,并且可以校正来自不同来源的数据噪音。因此,Sprod 可以被应用在目前大多数、以及未来可能出现的空间转录组技术中。并且,在整个数据分析的初始阶段对数据进行预处理,以提高整个数据分析流程的可靠性。”
图丨王允冠(来源:王允冠)
王允冠大学本科毕业于大连理工大学生物工程系,之后他的硕士和博士阶段分别在美国辛辛那提大学学习免疫学,以及生物信息学。
此前,他曾在哈佛医学院系统药物学实验室担任计算生物学家,期间开发了针对重复免疫荧光染色数据的质量检测和数据分析方法。
加入西南医学中心后,在与朱浩副教授的合作中,王允冠用单细胞分析结构 2 区干细胞的基因表达,并开发了组织定位系统图像分析软件,以进行大规模的系统图像处理[2]。通过这些分析,发现了 2 区肝细胞介导肝细胞间的动态平衡。
此外,在与牟平研究组的合作中,他还曾用单细胞转录组分析,揭示了 JAK-STAT 在前列腺癌中诱导细胞向类干细胞表型和多能性转化,从而导致药物抗性的重要作用[3]。
近年来,王涛实验室(Tao Wang Lab)在计算免疫学方面收获了系列丰硕成果。王涛教授的研究主要集中在研究免疫受体-抗原结合,单细胞转录组与免疫受体序列综合分析,利用空间转录组数据研究免疫学问题等方向。目前,定量生物学研究中心有多个博士后招聘职位(qbrc.swmed.edu/labs/wanglab,qbrc.swmed.edu/labs/xielab,qbrc.swmed.edu/labs/xiaolab),欢迎各专业生物信息学人才加盟。
1.Wang, Y., Song, B., Wang, S. et al. Sprod for de-noising spatially resolved transcriptomics data based on position and image information. Nature Methods 19, 950–958 (2022). https://doi.org/10.1038/s41592-022-01560-w
2.Wei,Y.,Wang, Y. et al. Liver homeostasis is maintained by midlobular zone hepatocytes. Sceinece 371, 6532(2021). DOI: 10.1126/science.abb1625
3.Deng, S., Wang, C., Wang, Y. et al. Ectopic JAK–STAT activation enables the transition to a stem-like and multilineage state conferring AR-targeted therapy resistance. Nature Cancer 3, 1071–1087 (2022). https://doi.org/10.1038/s43018-022-00431-9