服务热线02152235399
当前位置:博客 > 生物信息

比较stringtie 的merge 功能结果与cuffmerge结果差异

时间:2018-10-19    |    阅读量:6852

一、目的

比较stringtie 的merge 功能结果与cuffmerge结果差异

二、测试数据

2.1 物种:人类

2.2 测序类型: RNAseq

2.3 bam文件路径: https://erp.novelbio.com/NBCWebApp/task_getTaskResultPage?taskId=573d62469c064f7b74984816

2.4 stringtie merge结果:https://erp.novelbio.com/NBCWebApp/task_getTaskResultPage?taskId=574ceaef60b2f463a158f41e

2.5 cuffmerge 文件结果路径: https://erp.novelbio.com/NBCWebApp/task_getTaskResultPage?taskId=5743f3d17882a7d889085d1d

三、结果比较

3.1 数量统计

cuffmerge ERP 计算的FPKM结果中 有51213个基因;stringtie 的merge ballgown计算的FPKM有56427个基因;

共有的基因为18779个基因,cuffmerge特有32414个基因,stringtie merge特有37629个基因,共有基因数目少的原因是,新基因不同软件命名方式不一样。

3.2 使用IGV查看差异部分

stringtie merge输出了有reads覆盖的转录本(外显子)

stringtie merge输出了有reads覆盖的转录本(外显子)

reads覆盖的时候merge gtf应该与参考的gtf一致

reads覆盖的时候merge gtf应该与参考的gtf一致

结论:使用IGV查看两个gtf的区别,大部分(约80%到90%)都是相同的,stringtie merge的结果相较于cuffmerge会准确一些。

四、cuffmerge 结果gtf与stringtie merge结果gtf格式差异

4.1 cuffmerge结果

chr1 Cufflinks exon 11874 12227 . + . gene_id "XLOC_004584"; transcript_id "TCONS_00011998"; exon_number "1"; gene_name "DDX11L1"; oId "NR_046018.2"; nearest_ref "NR_046018.2"; class_code "="; tss_id "TSS6302";

chr1 Cufflinks exon 12613 12721 . + . gene_id "XLOC_004584"; transcript_id "TCONS_00011998"; exon_number "2"; gene_name "DDX11L1"; oId "NR_046018.2"; nearest_ref "NR_046018.2"; class_code "="; tss_id "TSS6302";

chr1 Cufflinks exon 13221 14409 . + . gene_id "XLOC_004584"; transcript_id "TCONS_00011998"; exon_number "3"; gene_name "DDX11L1"; oId "NR_046018.2"; nearest_ref "NR_046018.2"; class_code "="; tss_id "TSS6302";

4.2 stringtie merge结果

chr1 StringTie transcript 11874 14409 1000 + . gene_id "MSTRG.1"; transcript_id "NR_046018.2"; ref_gene_id "DDX11L1";

chr1 StringTie exon 11874 12227 1000 + . gene_id "MSTRG.1"; transcript_id "NR_046018.2"; exon_number "1"; ref_gene_id "DDX11L1";

chr1 StringTie exon 12613 12721 1000 + . gene_id "MSTRG.1"; transcript_id "NR_046018.2"; exon_number "2"; ref_gene_id "DDX11L1";

chr1 StringTie exon 13221 14409 1000 + . gene_id "MSTRG.1"; transcript_id "NR_046018.2"; exon_number "3"; ref_gene_id "DDX11L1";

请使用手机"扫一扫"x