第53卷第2期河南大学学报(自然科学版)Vol.53No.22023年3月JournalofHenanUniversity(NaturalScience)Mar.2023基于TCGA数据库构建肺腺癌相关免疫基因预后模型刘凤燕1,张元媛2,张琪1,罗雷1,李光琴1,戚文华1*(1.重庆三峡学院生物与食品工程学院,重庆万州404100;2.山西农业大学基础部,山西晋中030031)收稿日期:2022-09-16基金项目:国家自然科学基金资助项目(31702032);重庆市自然科学基金资助项目(cstc2019jcyj-msxmX0410)作者简介:刘凤燕(1999-),女,山东聊城人,硕士研究生.研究方向:分子生物学与生物信息学.*通信作者,E-mail:1085338601@qq.com摘要:从TCGA公共数据库中下载535个肺腺癌(lungadenocarcinoma,LUAD)肿瘤组织样品及59个正常组织样品及其相配的临床病例资料,提取样本全转录组测序结果.利用wilcox检验对两组样品进行差异表达分析,利用网址https://www.immport.org/下载免疫基因与肺腺癌转录组差异表达基因取交集,提取与肺腺癌相关的差异表达免疫基因.基于差异表达免疫基因,采用单因素和多因素Cox回归分析构建模型,并根据风险评分,将患者分为高风险组和低风险组;采用生存分析(K-M)和受试者工作特征(ROC)曲线分析检验模型预测效能.结果显示,共提取490个与肺腺癌相关的差异表达免疫基因,其中表达上调基因328个,表达下调基因162个,采用Cox单因素回归分析获得53个与生存时间相关的预后免疫基因,多因素Cox回归分析最终得到一个由15个预后免疫基因构建的风险评估模型.ROC曲线结果证实该模型对LUAD患者5a内生存率的分析准确性较高(AUC=0.721),单因素和多因素Cox独立分析提示riskscore(RS)能作为一个独立的预后指标(P<0.001).临床变量相关性的预后免疫基因表达分布分析发现,ANGPTL4、S100A16和SEMA4B3个免疫基因表达量在恶性肿瘤中表达较高.以上结果表明,本文所构建的预后免疫基因风险评估模型,可用于评估肺腺癌病人的预后风险值,为肺腺癌病人的预后治疗提供参考依据.关键词:肺腺癌;免疫基因;TCGA数据库;预后模型中图分类号:R734...