近日,来自好意思国哥伦比亚大学、好意思国斯隆—凯特林盘问所的盘问东谈主员,建筑出一款空间转录组分析新器用 Starfysh,它能在跨病东谈主样本的前提之下,分析组织中基因抒发的空间异质性。
看成一款空间转录组分析器用,Starfysh 仍是被课题组进行开源。同期,该团队也提供了代码调用教程(https://github.com/azizilab/starfysh)。
(来源:Nature Biotechnology)
Starfysh 处分了当今部分测序时候存在的低空间分辨率的劣势。该门径不错将不同组织的空间转录组数据、以及对应的组织学图片加以结合,通过空间基因抒发与组织学特征,针对不同位点的细胞类型与细胞景况比例进行展望。
与其他空间转录组门径比较,Starfysh 无需使用单细胞数据看成参考,因此在分析上存在较好的生动性,关于分析萧疏、且难以匹配单细胞测序的数据提供了新门径。
关于多量量病东谈主的数据,Starfysh 具有较强的会通智商,故能进行多量量的比较分析,从而能够提供一种全面且长远的分析面容。
看成一种新式盘算推算器用包,Starfysh 使用基于变分揣摸的门径,将组织学图像与空间转录组数据集成,进而开展去卷积的操作。
由于不需要来自于单细胞 RNA-seq 的参考数据,因此这是一个进攻的跨越。
因为,在组织学图像之中,包含关联空间依赖性结构的信息,这些信息不错疏浚数据的反卷积,比较针对非信息性空间的关联舛错项进行建模的面容,本次门径愈加准确。
关于此前的大多数空间时候来说,它们短少信得过的单细胞分辨率。而在机器学习框架的匡助之下,不错将组织学与空间转录组学加以结合,从而能够从空间转录组学之中,取得愈加精湛的发现。
(来源:Nature Biotechnology)
同期,Starfysh 能够整合不同盘问和不同患者群体的空间数据,从而不错行使更多的患者样本,来更好地发现萧疏的肿瘤微环境、或者识别不同肿瘤类型的耐药性机理。
当今,仍是有不少用户与迷惑者正在使用 Starfysh。以至已有学者在它的匡助之下,开展了一项针对玄色素瘤袖珍冷冻临床标本的盘问,关联论文仍是发表在 Nature Genetics。
Starfysh 的应用不仅局限于不同类型的肿瘤样本,关于发育生物学或药物研发关联的样本,也能带翌日常的应用。论文中,课题组也列举了一些全球数据在老鼠大脑皮层的应用着力。
同期,在盘问中该团队要点盘问了化生型乳腺癌。他们在 Starfysh 的匡助之下发现了稀奇空间性质,关于发展化生型乳腺癌的新式休养门径能够带来一定的疏浚作用。
与此同期,一些外部迷惑者也在积极探索相应的免疫细胞疗法,以期寻找休养这种萧疏型乳腺癌的灵验面容。总的来说,Starfysh 将能在生物医学数据分析限度带翌日常作用。
(来源:Nature Biotechnology)
空间基因抒发分析法亟待“破局”
据了解,在东谈主体体内的不同位置中,细胞的类型和发达有在一定的相反。细胞的空间位置、以及细胞之间的相互作用,能对人命举止起着决定性作用,比如能够决定组织的发育、决定关于药物的响应、以及决定肿瘤的发生与预后。
此前,已有的针对空间基因抒发的分析门径存在一定的局限性。举例:空间转录组测序时候,常常只可测量有限的基因数目;全基因组空间转录组测序时候,其空间分辨率相对较低。
同期,全基因组空间转录组的测序时候,常常无法针对单个细胞类型进行评估,比如无法辞别出某位点(spots)的不同免疫细胞与周围组织的相互作用。
而且,它也无法知谈不同细胞类型在空间中的漫步,因此只可在低空间分辨率的基因抒发层面上进行朦胧的分析。
关于显露与领悟复杂的生物系统举例领悟肿瘤微环境来说,上述局限性带来了一定遮拦。
举例,乳腺癌存在不同的亚型分类,关于不同亚型进行微环境表征时,需要对细胞类型在组织空间上进行描写与比较,以及领悟关于疗法存在不同响应的原因,比如领悟免疫细胞在亚型中的行动相反等。
五角形带来定名灵感
而之是以建筑 Starfysh,恰是因为盘问东谈主员发现已有的空间数据分析门径都依赖于单细胞数据。于是,他们但愿建筑一款不需要单细胞的门径。
盘问发轫,他们先是研发了一种半监督学习算法,试图使用 bottleneck 来辞别细胞类型。可是,该算法的鲁棒性和可讲明性都比较差。
于是,课题组决定加入细胞标识物等细胞特征、以及加入 Archetypes 看成先验学问。另一方面,由于 visium 数据能够匹配相应的组织学图像,是以他们启动念念考奈何行使这一部分的空间信息。
在屡次尝试不同模子之后,他们选拔 product of experts 的门径,来将图像与空间数据加以会通。同期,使用缓助深度生成模子的门径,来对图像与空间组学进行建模。
此外,课题组还使用 Archetypes 分析的门径来取得先验漫步,从而祛除关于单细胞数据的依赖。
其后,他们又对模子加以调整,不再使用缓助深度生成模子,转而对数据生成经过进行稍许修改,以便能对细胞类型完了更好的可讲明性。
在建筑器用包的期间,由于要在不同数据集上进行考证,于是他们假想了合成数据,也调用了公开数据集。
此外,课题组突出宽恕化生型乳腺癌样本,因此需要假想简便易懂的教程,以便捷其他盘问者使用。
这就条目他们不仅要具备算法建筑智商,还需要掌捏不同类型数据所触及的生物医学布景学问。值得红运的是,该团队的成员只怕领有不同的布景,从而能给盘问带来“交叉型助力”。
而在旨趣上,Starfysh 结合了 Archetypes 分析与图概率模子模拟基因抒发的测序经过。
通过 Archetypes 分析不错找出最具稀奇性的 spots,从而与已知细胞类型的 marker,共同判断组织中的预期细胞类型、或新的细胞类型,进而找到某位病东谈主样本中存在的稀奇细胞景况。
盘问中,课题组使用 Starfysh 发现了肿瘤细胞与不同免疫细胞相互作用的空间特征。
这种相反不仅存在于乳腺癌的不同亚型中,何况可能是某些亚型比如化生型乳腺癌耐药性的原因,而基于此制定新式休养决策,概况不错灵验克服耐药性。
同期,该团队要点盘问了化生型乳腺癌的肿瘤样本、与其他三阴性乳腺癌样本的相反。
遣发放现:免疫遏抑细胞比如营救性 T 细胞,在化生型乳腺癌中存在浸润惬心,而这有助于癌细胞更好地稳妥缺氧的微环境。
盘问东谈主员还发现 Starfysh 也能用于其他关联的空间数据,比如用于表征和分析鼠的淋逢迎组织、东谈主脑皮质组织、以及前线腺癌等。
由此可见,关于分析复杂生物组织的空间特征与轮廓图谱来说,Starfysh 是一种灵验的门径。
另据悉,课题组起原在三个细胞类型的合成数据集上来考证模子。可是,spots 的隐变量是聚拢的,因此在低维可视化时裸露为一个三角形。
而在五个细胞类型之时,奏凯出现了访佛海星的五角局势。天然这张五角图片,并未被选拔到论文的主图中。可是,他们以此为灵感,定下了 Starfysh 这个名字。
(来源:https://github.com/azizilab/starfysh)
最终,关联论文以《Starfysh 整合空间转录组和组织学数据以揭示异质肿瘤免疫中心》()为题发在 Nature Biotechnology[1]。
图 | 关联论文(来源:Nature Biotechnology)
博士生何锶瑜、金一诺和阿基里·拿撒勒(Achille Nazaret )是共并吞作。好意思国斯隆—凯特林癌症盘问所的亚历山大·Y·鲁登斯基()拔擢和乔治·普利塔斯()拔擢、以及好意思国哥伦比亚大学埃勒姆·阿王人()拔擢担任共同通信作家。
图 | 部分盘问东谈主员(来源:课题组)
盘问东谈主员临了示意:“刻下,AI for healthcare 正在成为越来越热点的话题,在基因组学和其他生物医学限度上都有纷乱的应用后劲。而本盘问恰是 AI 在生物医疗数据上应用的一个具体例子,慑服改日将会有更多、更广的应用。”
参考贵寓:
1.He, S., Jin, Y., Nazaret, A.et al. Starfysh integrates spatial transcriptomic and histologic data to reveal heterogeneous tumor–immune hubs. Nat Biotechnol (2024). https://doi.org/10.1038/s41587-024-02173-8
运营/排版:何晨龙
01/
02/
03/
04/
05/