长非编码RNA测序分析实战讲解之表达定量和差异及功能分析卜德超budechao@ict.ac.cnQQ/微信号:530242830中国科学院计算技术研究所2014-1-3•步骤四:表达值的定量–定量策略&工具•步骤五:差异分析–差异分析工具•步骤六:功能注释•附录:运行命令3转录组分析的通用套路定量鉴定差异功能有多少RNARNA的表达量结构、表达量、比例的变化功能注释测序数据和参考基因组比对测序评估及低质量过滤编码基因表达注释转录本重构长非编码鉴定长非编码表达注释编码基因差异(特异)表达GO功能显著性富集Pathway显著性富集功能富集网络图长非编码差异表达GO功能显著性富集Pathway显著性富集功能富集网络图FusionsJunctionsGenomeBrowser可视化转录组第五讲测序中国-测序学堂转录组第三讲转录组第四讲转录组第六讲•步骤三:转录本的构建(Cufflinks/Scripture)–构建流程详解–基因存储文件:Gtf,Bed格式文件–Cuffmerge/cuffcompare合并转录本–转录本构建效果评估•多外显子比率、已知覆盖程度•步骤四:长非编码RNA的鉴定–鉴定流程详解–关键:如何判断编码或是非编码基因•工具:CNCI,CPC,PhyloCSF上期回顾6一个测序实例•取样:晚期肝癌病人的肝组织(共4个)–癌旁组织(N)–原发灶(P)–转移灶(M)–门脉血栓转移灶(V)一组时间序列上的4个点的取样•步骤四:表达值的定量–定量策略&工具•步骤五:差异分析–差异分析工具•步骤六:功能注释•附录:运行命令8转录组分析的通用套路定量鉴定差异功能有多少RNARNA的表达量结构、表达量、比例的变化功能注释鉴定完成后的分析步骤9定量策略•FPKM–expectednumberoffragmentsperkilobaseoftranscriptsequencepermillionsbasepairssequenced•TPM–transcriptpermillion•RPKM–readsperkilobasepermillionmappedreads10定量•工具:–Cufflinks(FPKM)–Cuffdiff(FPKM)推荐–RSEM(TPM)推荐–Range(RPKM)FPKM定量•计算工具:cufflinks•输出结果–transcripts.gtf–isoforms.fpkm_tracking–genes.fpkm_tracking转录本定量?基因定量?定量:cufflinks-Gref.gtf–ooutdirtophat_outdir_N/accept_hits.bam长编码RNA表达定量蓝线:长非编码基因黑线:非编码基因NPMV•步骤四:表达值的定量–定量策略&工具•步骤五:差异分析–差异分析工具•步骤六:功能注释•附录:运行命令14差异分析•差异分析工具:–Deseq•Hypothesistesting•H0:nodifferencebetweentowconditions.•NegativeBinomialforreadscount–Cuffdif...