服务热线02152235399
当前位置:首页 > 科学研究 > 新闻动态
烈冰生物NovelBrain®云平台助力血液外泌体长链RNA数据库 时间:2017-10-25


最近Nucleic Acids Research杂志在线发表了人类血液外泌体长链RNA数据库exoRBase(www.exoRBase.org),收录了上万条环状RNA(circRNA)、长链非编码RNA(lncRNA)和mRNA。该数据库由复旦大学附属肿瘤医院/肿瘤研究所(复旦肿瘤所)黄胜林课题组完成,这是该课题组继2015年Cell Research首次报道环状RNA富集于外泌体并存在于血液中的工作延续。烈冰科技的NovelBrain®云平台提供了该数据库的基础RNA测序数据分析。



外泌体是近年的研究热点,作为纳米级别的小囊泡却有强大的功能和应用前景,特别是存在于体液中,是目前液体活检关注的重要领域。长链RNA包括mRNA、lncRNA和circRNA等,这些RNA数量多且存在很多组织细胞特异表达信息,近年发现它们可能被外泌体包裹释放到体液中,可作为疾病的诊断标志物或功能靶点,对外泌体长链RNA的研究正备受关注。黄胜林课题组在前期基础上,改进并完善了血液外泌体长链RNA的高通量测序方法,发现血液外泌体存在着众多的mRNA、lncRNA和circRNA。exoRBase正是基于这些分析基础上建立,旨在收录正常人和不同疾病患者血液外泌体里所有的长链RNA信息及其表达特征。exoRBase建立了一套针对外泌体RNA测序数据分析的标准流程,对环状RNA进行了预测和注释分析,同时比对和定量了lncRNA和mRNA表达情况。数据库可从多种角度(基因名、染色体定位、circRNA关联基因等)进行检索,并找到具有不同特性的外泌体RNA,及其组织特异性、疾病关联性和表达情况。exoRBase将为外泌体长链RNA研究和液体诊断提供有力的信息平台和靶点。


该数据库的基础RNA测序数据分析主要是基于烈冰科技的NovelBrain®云平台。烈冰科技自主开发的基因大数据分析平台(NovelBrain®)拥有强大的高性能计算能力、完善的样本及大数据管理系统,同时具备深度挖掘能力,并支持定制化分析模块自主上线。在国内初次实现了Hadoop-Docker生物信息框架,选取了Hadoop生态系统中的hdfs、zookeeper和YARN组件,并进行了一系列不同程度的优化,自主搭建了NovelBrain®科研云平台的分布式底层框架。同时采用轻量虚拟化技术Docker,并修改了Hadoop-YARN的底层代码,优化了其对Docker的支持,一方面实现了计算隔离,保证了系统的安全性;另一方面通过虚拟化机制实现分析软件和算法的一致性,保证数据分析可重现。在保证高效率并行计算的基础上,NovelBrain®开创了从任务投递、数据切分到容器多线程的三重调度加速框架,充分利用计算资源,大幅提高分析效率。NovelBrain®全程使用并实现“零代码”,解决了数据无法自动分析、软件操作难度大、分析需求无法定制和结果无法解读等问题。


目前,NovelBrain®云计算平台具备基因组、转录组、微生物和表观遗传学等模块,现已实现外显子组、小RNA、circRNA、ChIP-Seq等数十条分析工作流,并内置了上百个数据分析功能task簇,能满足科研工作者的日常分析需求。

复旦肿瘤所黄胜林课题组聚焦于肿瘤表观遗传和生物信息研究,近年在外泌体和环状RNA方面有一定的研究成果,在研究所建立了RNA高通量测序和生物信息平台。基于与烈冰科技共同开发的NovelBrain®科研云计算平台,开展了研究所高通量测序平台的常规分析,同时进行了深度分析流程开发,建立了外泌体长RNA分析等流程。烈冰科技希望通过与科研团队的深入合作,为更多的科研工作者提供高品质的数据解读服务,强强联合,促使生命科学向更高层的研究领域突破。