原位空间组学技术(Xenium In Situ)将新鲜冷冻(FF)和石蜡包埋(FFPE)组织中的数百种RNA进行表达分析并精确到亚细胞定位(200纳米),相较 Visium 空间转录组拥有更高的检测精度,将会对我们理解肿瘤微环境、免疫、神经科学、细胞特异性、生物发育等方面产生深远的影响,并进入空间单细胞/亚细胞研究的新时代。
1. 国内最早引入Xenium平台的公司之一,烈冰率先完成APT测试实验,现已正式开展客户的实验,实现样本即送即做,助力客户早日产出科研成果!
2. 烈冰是10x Genomics 官方指定的Xenium原位分析技术服务商!
3. 烈冰已助力发表多篇单转结合空转的高分文献,具有先进的冷冻切片机和数字切片扫描仪,具备丰富的空间多组学的数据分析经验!
4. 结合烈冰生物CytoNavigator百万级大通量生产级数据分析系统,能够实现个性化、定制化地数据分析服务,确保客户的研究达到最佳效果!
样本类型:
新鲜冷冻(FF)样本:新鲜组织OCT包埋后-80℃速冻,可连同包埋模具一同保存运输,在包埋模具上好做方向标记,用于确定切片方向;
石蜡包埋(FFPE)样本:包埋好的石蜡块或石蜡切片3-5张,4℃保存,干燥运输。
其它注意事项:
1. 可联系烈冰提供Xenium专用玻片由老师自行贴片,样本处理和运输过程需要在低温环境
2. 多样本拼片,需保证同一玻片选择的Panel相同
3. 组织大小要长宽小于10.45mm*22.45mm(实际捕获区域大小)
4. 切片质检:HE染色质控判断组织形态、空间信息保留是否完好,DV200 > 30%(DV200 为检测样品中大于 200nt 的 RNA 百分比)
5. 目前商业化panel仅支持人和小鼠物种(可定制增加100 genes),具有注释良好的转录组的其它物种需要提前定制设计(具体细节请在送样前与我司进行提前沟通)
Xenium运行结束无需测序即获得可解读,能可视化的结果,同时也兼容Seurat,Stlearn等第三方算法包,对于目的数据进行基于细胞和空间维度的分析与深层次解读,兼具易用性和深度。
一、实验分组:
1. Xenium In Situ平台:小鼠脑(FF/FFPE)&人类乳腺癌、肺癌、胶质母细胞瘤(FFPE)
2. 其他成像类平台
MERFISH:小鼠脑(FF)
CosMx:人类乳腺癌(FFPE)
MERSCOPE:小鼠脑(FF)
Molecular Cartography:人类乳腺癌(FFPE)
3.单细胞 RNA-seq:小鼠全脑图谱数据集
4.Visium 空间转录组:小鼠脑冠状面数据集
二、捕获平台:
Xenium In Situ、MERFISH、CosMx、MERSCOPE、Molecular Cartography
三、主要技术手段:
组织域(Tissue Domain)识别、空间可变基因(SVF)检测、细胞类型注释与聚类、基因插补(Imputation)等
Xenium原位平台是由10x Genomics公司开发的新型空间转录组学产品,能够以亚细胞分辨率对数百个基因进行原位定位。面对市面上众多空间转录组学技术,如何选择合适的平台并制定分析指南变得尤为重要。本研究选取了25个来自不同组织和物种的Xenium数据集,与另外八种空间解析转录组学技术及商业平台进行对比,重点考察其扩展性、分辨率、数据质量、功能优势及局限性。同时,研究者还对多种开源计算工具在Xenium数据集上的应用性能进行了基准测试,涵盖数据预处理、细胞分割、空间特征筛选和领域识别等任务。本研究不仅独立验证了Xenium的性能表现,更为此类数据集的分析提供了最佳实践指南和操作建议。
图1
基于成像的空间转录组(SRT)技术利用荧光显微实现单个RNA分子的靶向高通量检测,化学原理上分为MERFISH、SeqFIS等原位杂交法及ISS、STARmap等原位测序法;商业化产品如CosMx、分子图谱、seqFISH 迅速涌现,其中 10x Genomics 基于 ISS 的 Xenium 平台声称可提供亚细胞分辨的数百基因图谱(图 1a)。尽管 10x 已用其数据验证技术并做有限基准,仍缺乏独立全面评估,本研究通过系统比较 Xenium 与多种 SRT 技术,解析其数据特性、优势与局限,并优化计算分析流程,突出其在生物学层面的创新应用。
为深入解析Xenium数据特征,研究者整合了来自10x Genomics平台及Xenium仪器的25个实验数据集(共14项实验),涵盖多种样本类型、12亿读段与600万个细胞(图1b);每样本检测基因数210–392个,均提供3D坐标(x,y,z)、基因身份与qv,其中81%读段qv>20(72–91%),FF与FFPE切片无显著差异(图1b)。默认分割后,每个细胞平均获186.6条读段,76.8%成功分配,仅有0.21%细胞读段< 10而被剔除,表明Xenium适用于细胞类型频率评估。
2.Xenium可实现对种群的可重复识别
图1
为深入探究Xenium数据集的特性,研究者分析了来自小鼠大脑的七个相邻完整冠状面数据集。Xenium的细胞识别算法首先对DAPI染色的细胞核进行分割,随后扩展分割掩膜范围。通过分析分割细胞核的基因对应矩阵,研究者确定了50种可映射至组织结构的细胞类型,构建出细胞类型图谱(图1c)。在将这些细胞归类到解剖组织区域时,研究者观察到各区域特异性细胞类型分布一致(图1d)。使用相同探针面板对相似样本进行独立实验生成的数据集,在基因特异性检测效率、数据离散度和单细胞读数方面表现出高度一致性。不同实验间的细胞类型比例保持稳定,仅因样本间的生物学差异导致低丰度细胞群体存在显著差异。
3.Xenium保留了关键的三维和亚细胞细胞信息
图1
利用Xenium提供的三维坐标,研究者绕过分割步骤,以SSAM无分割模型直接解析分子空间特征,成功捕获44个细胞类型特异性簇并发现1.8%的细胞因z轴重叠导致信号混合(图1e);进一步用Points2Regions10系统识别亚细胞mRNA簇,将其分为核内、胞质与细胞外三类(图1f-i),并揭示同一细胞群内核-质表达差异,从而将数据集转化为三维亚细胞图谱而非仅含二维信息的表达矩阵。
4.Xenium检测效率与ISH相当
图2
研究以细胞组成已被scRNA-seq及多种SRT方法充分解析的小鼠脑为基准,系统比较了Xenium与Vizgen MERSCOPE、HS-ISS、MERFISH、Resolve分子图谱系统及Nanostring CosMx等成像平台,以及Visium测序平台的性能(图2a)。为消除分割偏差,所有数据均用Cellpose统一核分割并将< 10-30%读段分配至细胞(图2a)。限定等皮层、海马、丘脑区域后,发现CosMx单细胞读数最高,且读数随检测基因增多而升(图2b)。以scRNA-seq为参照计算各平台基因检测效率,结果显示Xenium灵敏度与MERSCOPE、分子图谱等ISH技术相当,且较Chromium v2高1.2-1.5倍(图2c);跨平台聚类亦证实各商业SRT每细胞分子数相近(图2e),提示行业在检测效率上的趋同。
图2
为了将Xenium的性能与基于测序的方法进行对比,研究者将其与最常用的单细胞测序研究者将Xenium与Visium(新鲜冷冻法)进行组织水平比较:因Visium无单细胞分辨率,双方在共同解剖区域按面积标准化统计伪批量基因特异性读段,结果Xenium灵敏度显著更高,中位数读段数达Visium的12.8倍,且Visium仅微弱检出的基因在Xenium中高度富集(图2g)。为衡量特异性,研究者提出负共表达纯度(NCP)指标(数值越接近 1,表明检测特异性越高),各SRT技术平均NCP均>0.8,其中HS-ISS与分子图谱最特异,Xenium略低但始终优于CosMx,剔除高表达基因后结论不变(图2d)。亚细胞定位显示,MERFISH/ISS读段更聚于细胞质心,而ISH商业平台(CosMx、分子图谱、MERSCOPE)读段分布更远,单基因层面差异尤为突出(图2f)。
5.核扩张影响细胞型表达谱
图3
核表达特征通常足以在原位定义细胞群体,但若结合胞质读数则能增强细胞聚类和标记效果。基于此假设,Xenium的核分割默认采用15 μm的半径扩展。这种扩展后的基因-细胞矩阵可识别出按区域特异性分群的细胞类型,与未扩展分割获得的更均质化分类形成对比。例如,丘脑少突胶质细胞被归类为与丘脑星形胶质细胞而非其他少突胶质细胞聚类,这表明扩展能捕捉区域特异性表达特征。为确定最佳细胞扩展参数,研究者为每种细胞类型和区域特异性背景表达特征定义了核表达特征(方法)。
图3
分析显示,平均距离细胞质心10.71 μm以上的转录本,其基因表达与区域特异性背景特征的相关性高于与细胞类型特异性核特征的相关性(图3a,b)。该距离可能反映了包含细胞核和胞质的细胞轮廓平均半径。鉴于本数据集中细胞核平均半径为5.06 μm,样本中细胞的理想扩展应为5.64 μm。但不同细胞类型呈现不同的最佳扩展距离(图3b)。因此,基于细胞核识别的分割策略随之而来。
6.Baysor和Cellpose优于标准的Xenium分割
图3
细胞分割对细胞分型准确性的影响促使研究者探索其他分割方法。研究者通过对比Xenium分割与常用策略的性能表现(图3c),发现这些策略可分为三大类:染色剂法(如使用DAPI辅助染色确定细胞位置,参见Watershed、MESMER和Cellpose);读取法(基于组织读取密度和成分定义细胞,如Baysor);以及混合模型(同时利用染色剂和读取位置定义细胞,如Baysor和Clustermap)。作为基础分割方案,研究者还纳入了基于组织均匀分布分箱的分割方法。此外,研究者对各分割结果分别应用了1、2、5、10和15μm的细胞扩展参数。
图3
研究者随后筛选出表现相似的策略组合(图3d。基于DAPI染色的策略生成了相似的输出结果,细胞扩增是导致其差异的主要驱动力。此外,基于Baysor、Clustermap和分箱策略的聚类结果显示出方法特异性,表明这些策略具有特定的分割输出特征。研究者将最优分割策略定义为在保持特定表达模式(通过负向标记纯度NMP量化)的前提下,最大化分配给细胞的读段比例的策略。NMP根据参考单细胞RNA测序数据计算各细胞类型预期检测到的读段百分比。研究发现,基于Baysor的策略——尤其是结合Xenium细胞核分割技术(BA2 P0.8)的组合策略——表现最佳(图3e)。
图3
值得注意的是,将Xenium的分割结果作为先验条件可显著减少漏检细胞。这些结论在所有数据集中均具一致性。最后,研究者将采用最佳策略(BA2 P0.8)分割的细胞与Xenium细胞核分割结果进行联合分析(图1c)。尽管Baysor策略的单细胞计数更高,但两种分割策略识别的细胞群体完全一致(图3f-h),细胞类型丰度差异主要表现为微小波动。总的来说,研究者的分析表明,Xenium的默认核分割掩膜提供了足够的信息来定义原位检测到的主要群体,与更复杂的分割策略相当。
7.准备Xenium数据:预处理的最佳实践
图4
为在原位识别细胞群体,研究者以Census29单细胞RNA测序数据集为参考,经缩减基因、调整检测效率并注入分割误差与技术噪声三步模拟Xenium数据(图4a),系统比较了含标准化、归一化、高变异性特征筛选及聚类在内的多种预处理流程及超参数组合。通过评估新聚类与参考标签的相似度,研究者确定最佳流程为:文库规模标准化至100、对数转换、缩放、利用全部主成分与16邻居构建k近邻图并实施Louvain聚类,该组合能持续最大化原始与新生成聚类间的一致性(图4b、c)。
图4
令人意外的是,部分最优工作流可省却对数转换而仅保留缩放,说明空间数据无通用预处理方案;随后以模拟数据验证,归一化方法、库规模、缩放比例及主成分数量被证实为关键调参项(图4d)。将所得最佳流程应用于真实Xenium数据并再次调参(图4e)发现,高维特征筛选、标准化与缩放缺一不可,缺失任一环节均显著改变聚类结果,且该结论跨数据集一致并与模拟数据高度吻合。
8.使用Xenium数据集选择空间可变特征
图4
为替代高维筛选,研究者用完整Xenium数据集比较了八种常用空间可变特征(SVF)算法(Moran's I、Geary's C、Hotspot、SomDE、SpatialDE、Sinfonia、Seurat标记变差函数、Giotto),发现各法所得SVF比例差异显著,但除SpatialDE、Seurat标记变差函数及Geary's C(5000细胞)外,基因排序一致性良好(图4f、g);在将基因判为SVF时,Seurat、Sinfonia等倾向高比例,Hotspot、Squidpy更保守(图4h-j)。利用无空间变异的对照探针评估假阳性,Hotspot表现最佳(误选 < 5%),而SVF比例高的算法假阳性同步升高,提示噪声仍被误判;相比之下,用于高变特征(HVF)的算法可完全排除对照探针并稳定检出≈18% HVF(图4i、j)。
9.在Xenium数据集上对基因推断工具进行基准测试
图5
为突破靶向SRT的基因通量限制,研究者沿用Li等人流程(图5a),以PCC、SSIM、RMSE、JS四项指标对gimVI、SpaGE、Tangram、Liger、Seurat、SpaOTsc、NovoSpaRc七种插补方法进行基准测试,结果一致认定SpaGE最优,Seurat、Tangram和SpaOTsc亦表现优异,而gimVI整合效果逊于既往报道(图5b)。该流程还通过比对实测与插补表达,识别出scRNA-seq与Xenium整体一致性偏低的基因;量化各基因-方法PCC差异发现,插补性能差异显著且跨方法一致(图5c)。进一步分析表明,表达水平及基因间整体相关性是决定插补效果的最显著特征,而转录本亚细胞定位或表达变异性影响甚微(图5d-f)。
10.评估计算工具以探索组织结构
图5
解析组织结构有助于理解其功能。虽然寻找可靠的结构域定义工具备受关注,但目前尚缺乏独立对比研究。为此,研究者对五种结构域识别算法(Banksy、DeepST、SpaGCN、SPACEL和STAGATE)进行了基准测试,将它们与艾伦脑图谱冠状P56切片中专家人工标注的区域进行比对(图5g)。研究者还纳入了两种简单细胞区室识别方法(基于分箱法和基于邻域法)。结果显示,基于分箱聚类预测的结构域与人工标注结果高度吻合,其表现优于更复杂的算法(图5h)。不过,这些发现可能受所分析组织类型结构特征的影响,意味着不同方法在不同组织类型中的表现可能存在差异。
基于本文证据,研究者提出一条端到端的最优Xenium数据处理与分析流程(图示整合摘要):以原始Xenium数据为输入,先用Cellpose核识别、再用Baysor分配读段完成细胞再分割,无需扩增;若分割不佳,可改用SSAM9或Points2Regions10无分割法直接提取分子特征。随后将细胞-基因矩阵按单细胞RNA测序标准流程(细胞过滤→对数转换与标准化→PCA→降维→聚类)进行细胞类型鉴定。空间变异基因排序可用多算法但需留意结果差异;若有scRNA-seq,可用Seurat、SpaGE或Tangram做基因填补;域识别可采用基于分箱策略或Banksy、SPACEL等算法。