Ab-Seq/CITE-Seq单细胞多组学分析利器,同步揭示蛋白质与mRNA深度信息。
高通量测序能够检测大量RNA靶点,极大地促进了我们对复杂生物系统的了解。然而,若要进一步探究基因调控和单细胞异质性,可选择同时获取有关RNA和蛋白表达的信息,从多维度进行深入研究。
细胞表面蛋白检测原理:
Ab-Seq/CITE-Seq使用寡核苷酸偶联抗体(Ab-oligos)从高通量测序数据中检测蛋白表达。Ab-Seq/CITE-Seq中的每个抗体克隆都被偶联到一个包含抗体特异性条形码(ABC)的特定寡核苷酸上。结合使用Ab-Seq/CITE-Seq与单细胞分析系统,可同时检测样本中的mRNA和蛋白表达。
Ab-Seq/CITE-Seq抗体具备高特异性。高特异性、低背景是评估抗体的重要指标,Ab-Seq/CITE-Seq产品在研发阶段经过滴定,已确认最佳抗体浓度及使用标准,能够确保抗体最佳的特异性(识别到对应的抗原)和低背景(结合到目标细胞以外的细胞上)。
一、多组学分析提供更明确的聚类
二、检测相应低丰度mRNA的蛋白靶点
三、识别新的差异表达基因
Ab-Seq/CITE-Seq可以在单细胞水平同时检测蛋白和RNA的表达,增强细胞表型分辨率,同时验证和补充RNA数据,更全面地反映细胞状态。单细胞多组学超越了传统的整体分析,能够同时解析特殊细胞群的各组学层面信息,大幅提高单细胞研究效率和深度。
样本类型:
组织、血液、培养的细胞系、制备好的单细胞悬液
注:若客户样本为组织,且无能力进行组织解离来获取单细胞悬液,烈冰将尽可能提供技术及实验上的帮助,但因不同类型样本的特异性,无法保证实验方法适用于所有类型组织。
质量要求:
1. 细胞活性大于70%
2. 浓度为500-2000细胞/μl
3. 体积不小于200μl
4. 细胞培养基及缓冲液不能含Ca2+和Mg2+
5. 细胞体积小于40μm
AbSeq与流式细胞术之间存在良好的定量相关性,对于明确分辨的标记物一致性尤为显著。
即使是低丰度细胞群,如CD1c+传统树突状细胞(cDCs)和交叉呈递的 CD141+ cDCs,也能通过其表面蛋白表型清晰地识别出来。
流式分选细胞表面 markers
CD 分 子(cluster of differentiation)是细胞表面的 marker,用于白细胞的鉴定和表征。CD 命名法是由 1982 年成立的 HLDA 研 讨 会(Human LeukocyteDifferentiation Antigens)开发和维护的。目前,CD 命名法已经广泛用于人、 小鼠和其它物种中,该图展示了人和小鼠不同细胞类型表面的 key markers。
BD AbSeq寡核苷酸偶联单克隆抗体库:
烈冰生物与碧迪医疗联合推出了包含200+抗体的BD AbSeq寡核苷酸偶联单克隆抗体库,覆盖了肿瘤免疫、自身免疫性疾病、感染性疾病等多个领域,为疾病诊断和治疗提供了重要的研究工具。这些抗体分为细胞分型、信号传导、细胞增殖与分化、疾病诊断与监测等多个类别,每一类抗体都为相关领域的研究提供了更全面的生物学数据。
一、实验分组
健康骨髓样本6例(3年轻+3老年)
急性髓系白血病(AML)患者15例(6例APL+9 例 NPM1 突变)
二、捕获平台:
BD Rhapsody+BD FACSAria II/Fusion+BD FACSFortessa/LSRII
三、主要技术手段:
AbSeq、流式细胞术、qPCR验证等
单细胞基因组学技术彻底改变了我们对复杂细胞系统的认知。然而,高昂的成本和缺乏新发现细胞类型的纯化策略,阻碍了它们的功能表征与大规模分析。本研究构建了人类血液和骨髓的高内涵单细胞蛋白质基因组参考图谱,通过定量关联多达197种表面标志物的表达,揭示了健康衰老和白血病患者中所有主要造血细胞类型的身份特征与生物过程。这些参考图谱可自动设计出成本效益更高的高通量细胞术方案,其性能超越现有顶尖方法,既能精准反映细胞系统的复杂拓扑结构,又能实现精确定义的细胞状态纯化。通过系统整合细胞术与蛋白质基因组数据,我们得以在单细胞水平测量已精确定位细胞状态的功能能力。本研究不仅为细胞术领域提供了便捷的资源库,更开启了数据驱动时代的崭新篇章。
1.血液肿瘤单细胞蛋白质基因组参考图
图1
为构建人骨髓单细胞转录组-表面蛋白参考图谱,作者开展了 Abseq 实验:采用 97–197 种寡标记抗体,对髂骨骨髓单核细胞进行标记,随后在 BD Rhapsody 平台上,完成靶向 462 - mRNA panel检测或全转录组单细胞 RNA 测序(scRNA - seq)(图 1a)。该panel系统覆盖 造血干祖细胞(HSPC)各分化阶段、细胞身份基因及状态标志物,经全转录组验证,不存在细胞群体遗漏情况。随后,作者将 97-表面标记方案用于 3 名年轻健康、3 名老年及 3 名初诊 AML 患者的骨髓样本(图 1a),其中健康样本富集 CD34⁺ 细胞以详析 HSC 分化,AML 样本视情况富集 CD3⁺ 细胞以保证 T 细胞覆盖为验证高维抗体复用体系的可靠性,研究团队设计了三组对照实验:抗体存在 / 缺失的配对实验、新鲜样本 / 冻融样本的配对实验,以及测序深度评估实验,结果均证实该实验流程具有良好的稳健性。
最终,整合 70,017 个高质量 BM 细胞的 RNA 与表面蛋白信息后,鉴定出 45 种细胞类型,覆盖 CD34⁺ HSC 分化全程、CD3⁺/CD56⁺ T-NK 群体、CD33⁺ 髓系亚群及 CD10⁺/CD19⁺/CD38^hi B 细胞各分化态(图 1b, c),并纳入细胞毒性 CD4⁺ T 细胞与 MSC 等罕见群体。值得注意的是,年轻与老年供体的骨髓细胞状态高度一致,而 AML 患者则呈异质性(图 1b)。重要的是,RNA和表面蛋白信息的结合提供了更高的分辨率,并揭示了单个数据层不容易识别的细胞类型。
图1
除了主要参考文献数据集之外,作者还生成了 "查询"单细胞蛋白质基因组数据集,这些数据集在主要参考文献的背景下显示。这些数据集具体包括:1. 运用含 197 种抗体的复合物检测 panel,分析健康个体的骨髓(BM)及配对的外周血(PB)样本,借此在研究构建的参考体系中,探究更多表面标记物的表达情况 ;2. 针对健康骨髓,采用含 97 种抗体的复合物检测 panel 结合全转录组图谱的策略,以此查询参考体系所定义范围内任意基因的表达状态 ;3. 利用含 97 种抗体的复合物检测 panel 分析 CD34⁺CD38⁻ 骨髓细胞群,进而提升对未成熟造血干祖细胞(HSPCs)的解析精度 ;4. 纳入 12 例AML患者的相关样本数据 。
为了使作者的资源更易于理解,作者开发了 Abseq 应用程序,这是一款基于网络的应用程序,可以实现基因和表面标记表达的可视化、差异表达测试以及本手稿中所有数据集的数据驱动门控方案。该应用程序的演示视频见补充资料。Abseq 应用程序的网址是: https://abseqapp.shiny.embl.de/
图2
尽管表面标记物广泛用于识别细胞类型、细胞阶段和生物学过程,其个体重要性仍不明确。为此,作者将每个细胞精确归入细胞类型,并量化其分化阶段、干性得分、细胞毒性得分、细胞周期阶段及技术协变量。通过无监督因子模型进一步引入未知生物过程协变量,且非技术协变量不受标记表达水平影响。对每个表面标记,作者计算了上述过程对其表达方差的解释比例(图 2a),由此鉴定出可指示细胞类型身份、分化阶段、干性、细胞毒性和细胞周期等关键生物学特性的标记物。
图3
为验证分析发现的新标记,作者聚焦能特异指示 HSPC 分化阶段的表面分子,在 CD34⁺ HSPC 内完成拟时序分析,筛选出随红细胞、巨核细胞、单核细胞、cDC 或 B 细胞轨迹动态变化的标记物;其中单核轨迹亦含中性粒细胞祖细胞,而成熟中性粒因采用密度梯度离心法缺失,且浆细胞样 DC 与 Eo/Ba 轨迹因细胞稀少未予解析 (图 2d)。伪时间量化经典标记表达动态(如泛分化 CD38、早期 B 细胞 CD10、cDC-单核 CD11c),并揭示 CD326、CD11a、Tim3 等可精确划分谱系承诺阶段的新标记 (图 2d; 图 3)。通过 FACS-index scRNA-seq 及单细胞培养验证:CD326 特异预示红细胞承诺 (图 3c–g),Tim3 与 CD11a 则为泛髓系承诺标记 (图 3c,h-o);CD98 被确认为 HSPC 新泛分化标记 (图 2d)。进一步解析 B 细胞分化全程,锁定承诺、成熟、同型转换及终末浆细胞生成的特异表面标记。
作者的模型提供了对细胞类型特征、分化阶段和生物过程与单个表面标记表达之间关系的全面定量了解。与这些过程相关的表面标记的全面概述见补充资料。
3.健康衰老和癌症中的表面蛋白表达。
图4
为探究健康衰老对表面蛋白表达的影响,作者对比了年轻与老年健康个体的骨髓 Abseq 数据,发现两组所有骨髓细胞群体的表面分子表达高度相似(图 4a,b),提示整体模式在衰老中保持稳定且受严格调控。尽管细胞类型频率仅轻微变化,但细胞毒性 CD8⁺T 细胞显著累积。此外,FAS(CD95)、CD155 及 CD275 等免疫调节分子的表面表达随年龄改变,尤其幼稚 CD8⁺与 CD4⁺T 细胞亚群的共刺激分子CD27 表达下降(图 4b,c),表明健康衰老中免疫调节分子的表面呈现发生选择性变化。
图4
为解析急性髓细胞白血病(AML)的表面标志物重塑,作者收集了 15 例患者(6 例 t(15;17) 急性早幼粒细胞白血病,9 例 NPM1-mut 正常核型 AML,其中 4 例伴 FLT3-ITD)的单细胞蛋白-基因组图谱。健康 BM 拓扑一致,而 3 例初诊 AML 已显示患者特异性改变与显著异质性 (图 1b)。将白血病细胞投影至健康参考框架,可精细定位分化阻滞阶段 (图 4d);基于分化阶段丰度无监督聚类得到三类 AML:单核细胞型(富集经典单核表型胚泡)、APL(阻滞于早幼粒阶段)及未成熟型(富集 HSC/MPP/ELP 样胚泡) (图 4e,f)。差异表达显示,区分 AML 亚型的表面标志物(CD133、CD14、CD11b 等)亦标记对应健康阶段 (图 4g),并揭示潜在靶点 PD-L1 (CD274) 与 CTLA4 (CD152) 的差异表达 (图 4h)。同一分化阶段的 AML vs 健康比较发现白血病特异高表达标志物,包括已知白血病干细胞标志 CD25、Tim3、CD123、CD45RA33 (图 4i),且其患者间变异显著。该"健康参考投影 + 细胞状态差异检验"流程有望成为血液病 scRNA-seq 分析的标准范式。计算程序可在 https://git.embl.de/triana/nrn 在线查阅。
4.用于免疫学的数据驱动流式细胞仪
图5
为克服传统流式门控"试错"经验、稀有亚群纯度不足等局限,作者用机器学习框架对全数据集进行数据驱动门控设计:所有细胞群的机器门控均较文献经典方案显著提高纯度(图 5a),其中 Hypergate 算法在保持高纯度的同时拥有更高召回率(图 5a)。随后,作者聚焦两种罕见且特征不清的骨髓群体验证此法:
细胞毒性 CD4⁺T 细胞——Hypergate算法 给出 CD4⁺CD28⁻免疫表型,其 CD7、CD25、CD127、CD197 表达显著低于其它 CD4⁺T 亚群(图 5b-e);该门控在健康及多种血液病患者骨髓中得到流式验证(图 5d),FACS 分选后 qPCR 证实其细胞毒性基因表达(图 5f)。
图5
间充质干细胞在 BM 中是一种罕见的异质性细胞。虽然体内外扩增的间充质干细胞已被广泛表型,但原代人类间充质干细胞的表型仍不完善,特别是由于其频率极低。在作者的数据集中,作者捕获了少量异质性间充质干细胞,其中一个亚群(MSC-1)中关键的细胞因子 CXCL12 高表达(图 5g)。Hypergate 算法发现通过表达 CD13 和不表达 CD11a 最有效地分离出表达CXCL12 的间充质干细胞(图 5h)。事实上,CD13+CD11a-间充质干细胞的流式细胞分析验证了作者的Abseq数据所提示的免疫表型,并证实了作者的方法所发现的已知和新的间充质干细胞表面标记(图5i,j)。此外,基于 FACS 技术分离 CD13+CD11a- 细胞并进行转录组分析后发现,CXCL12和其他关键间充质干细胞特征基因高度富集(图 5k)。
这些分析结果表明,作者的方法可以从数据中推导出选通方案,并绘制出特征不明显人群的表面标记表达图谱。结合作者的单细胞蛋白质基因组参考图,Abseq 应用程序允许用户为任何感兴趣的群体定义新的数据驱动的分选方案。
5.用于人类造血的数据定义选通方案
图6
为获得最贴近转录组状态的 HSPC 流式方案,作者以"Young1"样本 CD34⁺ 细胞的 Abseq 数据训练决策树,构建出仅需 12 种表面标志物即可定义 14 个分子精准细胞状态的全新门控策略 (图 6a–c)。该数据驱动方案在识别谱系定向祖细胞方面显著优于现有专家方案,所产生的细胞群体转录同质性更高 (图 6d,e),且功能输出与"共识门控"相当、信息量却更丰富。作者随后在经典流式平台上实施该 12-marker panel,配合 Smart-seq2 index scRNA-seq 验证:新门控可高效分离分子定义的细胞状态 (图 6f,g),在训练与验证数据中的解析力均显著优于传统专家方案 (图 6h)。总之,研究结果表明,高含量单细胞蛋白质基因组图谱可用于推导数据定义的细胞测量panel,从而高精度地描述复杂生物系统的分子状态。此外,作者的选通方案允许使用经济高效的流式细胞仪忠实地识别和前瞻性地分离人类造血层次中转录组定义的祖细胞状态。
6.将流式细胞仪数据映射到单细胞参考图上
图7
为把离散门控的FACS数据嵌入连续分化空间,作者开发开源算法NRN(git.embl.de/triana/nrn),通过秩归一化统一流式与Abseq尺度后以k-NN将单个细胞投射至蛋白-基因组参考UMAP;用12-marker及11-marker的panel在FACS-indexed Smart-seq2数据上验证,分子定义细胞类型被精准映射(图7b),投影精度与全转录组整合相当,且关键谱系基因随伪时间的表达动态与位置高度吻合(图7c),证明NRN可借流式细胞术解析造血分化连续性。
图7
为克服单细胞基因组学对细胞功能分化潜能认知不足的限制,作者利用图6定义的门控panel,在单细胞培养实验中同步记录表面标志物,并通过NRN算法将所得流式数据映射回Abseq参考图谱——结果显示:最具增殖及多谱系潜能的细胞定位于表型HSC/MPP区室,沿转录组轨迹分布的HSPC则按序增加相应子代比例(图7d);功能单能祖细胞既出现在对应轨迹也可见于HSC/MPP区室(图7d,g),而寡能细胞则富集于HSC/MPP并呈现红-巨核-嗜酸/嗜碱及淋巴-中性-单核-树突状等显著高于随机的命运组合(图7e,f,g),提示存在转录组未捕获的随机或层级调控。综上,造血谱系定向主要沿转录组预测路径连续进行,早期即分化为红系与淋巴髓系两大分支;作者的数据资源与NRN算法相结合,可准确整合流式与单细胞基因组数据,实现用流式细胞术描绘连续分化并将功能数据映射至基因组空间。
1、构建了首个高分辨率单细胞蛋白-基因组参考图谱
整合了97–197种表面标记与转录组数据,系统覆盖了健康与白血病状态下骨髓和血液中所有主要造血细胞类型及分化阶段,共鉴定出45种细胞类型和状态。
2、实现了表面标记与细胞身份/生物学过程的定量关联
明确了每个表面标记在细胞类型识别、分化阶段、干性、细胞毒性或细胞周期中的功能权重,识别出新型阶段特异性标记(如CD326、CD11a、Tim3、CD98)。
3、开发了数据驱动的流式细胞术设计工具
基于机器学习算法(如Hypergate 算法、决策树)自动生成高纯度、高召回率的分选方案,显著优于传统人工门控策略,尤其适用于稀有细胞群(如细胞毒性CD4⁺T细胞、间充质干细胞MSCs)。
4、重新定义了HSPC的分群与功能
提出新的HSPC分群方案,更精准地映射转录组定义的分化轨迹,并通过功能实验验证其分化潜能的预测能力,解决了经典门控策略中纯度不足、功能异质性高的问题。
5、建立了血液肿瘤的精准分型与靶向治疗框架
将AML样本投射到健康参考图谱上,精确定位分化阻滞阶段,鉴定出白血病干细胞特异性标记(如CD25、Tim3、CD123、CD45RA),为个体化免疫治疗提供分子依据。