相信单细胞领域的小伙伴们对SCENIC分析(Single-Cell Regulatory Network Inference And Clustering)并不陌生,但如何升华该分析的生物学意义?如何将自己的结果制作成高分文章的样子(SCENIC热图)?难倒的英雄好汉应该不少。(赶紧关注我们吧~为您讲解详细的ScRNA-Seq数据分析结果,及具体分析工具!!!)
Ø SCENIC分析高分文章案例分享:
SCENIC分析是对ScRNA-Seq数据中转录因子(Transcription Factors,TFs)进行研究,最终筛选得到调控强度显著、处于核心作用的TFs,结果通常以热图形式展示。尤其在肿瘤学中,SCENIC分析可以帮助找到与肿瘤发生发展相关的关键“驱动基因(Driver)”,从而为探究其发病机制奠定基础。
图1 肺癌组织中内皮细胞SCENIC分析热图
(图片来源于文献Lambrechts, D., et al. "Phenotype molding of stromal cells in the lung tumor microenvironment. " Nature Medicine 24.8(2018):1277. IF=32.621)
图1为肺癌组织中内皮细胞SCENIC分析结果。其中,EHF在肿瘤中表达具有异质性,在肿瘤发生及不同阶段发挥不同作用。从图1可以看出,与非恶性内皮细胞相比,EHF在Tumour细胞中具有较显著的调控作用,提示可以进一步研究EHF通过开启下游何种信号通路调控Tumour细胞的增殖与迁移,进而影响肺癌进展。
Ø SCENIC分析工具
图2 SCENIC分析流程
l step 1:采用grnboost2识别并筛选出与TFs共表达(co-expression)的基因。注意:其中部分基因仅与TFs表达相关,而非靶基因;
l step 2:使用RcisTarget对每个共表达模块进行显著性Motif富集,筛选得到显著表达的靶基因,我们将每一对TFs与靶基因的组合称为调节子(regulons)。
l step 3:采用AUCell算法对每一组regulon的转录活性进行打分,从而确定TFs对靶基因的调控强度(图2)。
(算法参考文献:Aibar, Sara, et al. "SCENIC: single-cell regulatory network inference and clustering." Nature methods 14.11 (2017): 1083.)
Ø 烈冰科技SCENIC分析工作流搭建
Ø 结果展示
小编以发表于《Nature》的脑组织测序数据为Demo,进行了SCENIC分析,结果如下:
1. TFs调控强度t-SNE图
我们根据AUCell算法对TFs调控强度的打分值进行染色,绘制了不同TFs在各细胞中调控强度的 t-SNE图(图4)。结合鉴定的细胞类型,得到转录因子ISL1在GABA神经元中调控强度较高,SOX5则高强度调控谷氨酸能神经元,FOXA1在星形胶质细胞中调控作用较高,E2F1则显著调控中间前体细胞与放射状胶质细胞。
图4 不同TFs的调控强度
(数据来源:Birey F , Andersen J , Makinson C D , et al. Assembly of functionally integrated human forebrain spheroids[J]. Nature, 2017.)
2. TFs调控的靶基因
表1记录了每个TF调控的靶基因及对应的调控强度(仅展示调控强度Top20的regulons)。TFs所调控的靶基因往往不止一个,如FOXA1可以调控靶基因SPON1、NTN1和SULF1。该部分结果将为后续筛选关键TFs提供一定的依据。
表1 TFs调控的靶基因及其调控强度
3. TFs调控强度热图
图5展示了该脑组织各神经细胞类型调控强度较高的TFs热图(一般文章发表时多采用此图),可以从图中挑选出特定细胞类型高调控强度的TFs,为下一步Driver的研究和验证奠定基础。以此图为例,可以看出E2F家族在中间前体细胞中调控作用显著增强,提示E2F可能成为中间前体细胞群体中的驱动基因。
图5 TFs调控强度的热图
Ø SCENIC分析拓展
SCENIC分析不仅可以用于筛选得到有价值的TFs,还可以结合其他的验证手段或数据分析工具来探索更深层次的生物学意义。这里小编为大家提供了一些TFs后续研究的分析思路,欢迎大家在下方留言~:
1. 在研究某种疾病进展(如肿瘤的复发、转移)时,我们可以针对特定的细胞类型,对该细胞类型进行SCENIC分析,找到与复发、转移特定功能相关的TFs及其靶基因,从而通过分子生物学手段(敲低/过表达等)在体外进一步验证。
2. 结合基因模块(gene module)分析及TFs注释,判断TFs是否是关键基因(hub-gene),分析其调控的相关通路和靶基因,建立起以TFs为驱动中心的调控网络。