长非编码RNA测序分析实战讲解之转录本构建和长非编码RNA鉴定卜德超budechao@ict.ac.cn中国科学院计算技术研究所2014-12-20概要•步骤三:转录本的构建–构建流程详解–转录本构建效果评估•步骤四:长非编码RNA的鉴定–鉴定流程详解–关键:如何判断编码或是非编码基因•附录:运行命令3转录组分析的通用套路定量鉴定差异功能有多少RNARNA的表达量结构、表达量、比例的变化功能注释测序数据和参考基因组比对测序评估及低质量过滤编码基因表达注释转录本重构长非编码鉴定长非编码表达注释编码基因差异(特异)表达GO功能显著性富集Pathway显著性富集功能富集网络图长非编码差异表达GO功能显著性富集Pathway显著性富集功能富集网络图FusionsJunctionsGenomeBrowser可视化这一堂课关注内容上期回顾•长非编码RNA测序–mRNA测序(带polyARNA)–不带PolyA的RNA测序–去除rRNA的RNA测序•步骤一:测序数据评估–fastqc:reads质量,碱基分布•步骤二:回贴基因组–Tophat–双比对策略6一个测序实例•取样:晚期肝癌病人的肝组织(共4个)–癌旁组织(N)–原发灶(P)–转移灶(M)–门脉血栓转移灶(V)一组时间序列上的4个点的取样•步骤三:转录本的构建–构建流程详解–转录本构建效果评估•步骤四:长非编码RNA的鉴定–鉴定流程详解–关键:如何判断编码或是非编码基因•附录:运行命令8转录组构建的通用套路合并转录本单样本构建构建质量评估一套实验的测序得到的整个转录组•步骤三:转录本的构建–构建流程详解–转录本构建效果评估•步骤四:长非编码RNA的鉴定–鉴定流程详解–关键:如何判断编码或是非编码基因•附录:运行命令转录本构建•转录本构建工具–Cufflinks(推荐)–ScriptureCufflinks:报出最少的可变剪切组合,力求转录本更长Scripture:报出最全的可变剪切组合,力求转录本更全基因注释文件:BED格式文件•BED格式12列:–Chrom,Start,End,Name,Score,Strand,CDSS,CDSE,itemRgb,blockCount,blockSizes,blockStarts基因注释文件:Gtf格式文件•Gtf格式9列:–Chrom,Source,Featrue,Start,End,Score,Strand,frame,groupCufflinks系列•Cufflinks软件套装–Cufflinks(转录本构建、FPKM表达定量)–Cuffcompare(转录本比较、合并转录本)–Cuffmerge(转录本合并)–Cuffdiff(差异分析)构建:cufflinks–ooutdirtophat_outdir_N/accepted_hits.bam定量:cufflinks-Gref.gtf–ooutdirtophat_outdir_N/accept_hits.bam转录本合并N.gtfP.gtfM.gtfV.gtfMerge.gt...