基于生物信息学分析筛选和鉴定神经胶质瘤患者预后评估的潜在长链非编码RNA

(整期优先)网络出版时间:2021-10-10
/ 1
摘要目的探讨筛选出的长链非编码RNA(lncRNA)作为评估神经胶质瘤预后标志物的可能性。方法选择癌症基因组图谱(TCGA)数据库建库至2018年12月的694个胶质瘤样本和5个癌旁组织样本,筛选胶质瘤组织与癌旁组织间有差异的lncRNA、微RNA(miRNA)和mRNA,分析三者与神经胶质瘤患者预后的相关性,并构建竞争性内源RNA(ceRNA)网络。基于基因本体(GO)数据库和京都基因与基因组百科全书(KEGG)数据库对mRNA的生物学功能进行富集分析。采用Kaplan-Meier法对各lncRNA、miRNA或mRNA不同表达水平患者进行生存分析,获得与预后相关的lncRNA、miRNA和mRNA。通过单因素和多因素Cox比例风险回归模型分析ceRNA网络中有差异的lncRNA,构建预测患者5年总生存率的lncRNA预后模型。根据构建的模型,计算TCGA数据库中694个样本每个样本的危险值,以中位危险值为临界值,将患者分为高风险组(≥中位危险值)、低风险组(<中位危险值),并绘制两组的生存曲线;绘制依据lncRNA预后模型的危险值预测TCGA数据库中神经胶质瘤患者5年总生存率的受试者工作特征(ROC)曲线;采用pheatmap R软件包绘制高、低风险组患者预后模型中各lncRNA基因表达水平的热图。结果从TCGA数据库共得到神经胶质瘤与癌旁组织间有差异的44个lncRNA、19个miRNA和54个mRNA,并绘制出ceRNA网络图;经Kaplan-Meier法分析,其中22个lncRNA、7个miRNA和38个mRNA与患者总生存相关。单因素Cox回归分析得到28个与预后相关的lncRNA,经多因素Cox回归分析,根据赤池信息准则(AIC)查找最优的涉及16个lncRNA的预后风险模型,即危险值=ARHGAP31-AS1×(-0.357 7)+ LY86-AS1×(0.155 1)+WARS2-IT1×(0.206 4)+PART1×(-0.110 0)+AC110491.1×(-0.142 6)+CACNA1C-IT2×(-0.381 3)+HAS2-AS1×(0.128 8)+AC092171.1×(-0.161 3)+CCDC26×(-0.144 2)+HCG15×(0.384 0)+AL359541.1×(-0.289 2)+GRM5-AS1×(0.120 5)+LINC00237×(-0.085 1)+LINC00310×(-0.213 0)+VCAN-AS1×(-0.090 3)+LINC00303×(0.091 5)。根据构建模型计算的中位危险值为0.758,高风险组患者5年总生存率为16.8%(95% CI 11.4%~24.7%),低风险组患者5年总生存率为75.7%(95% CI 68.5%~83.7%)。构建的lncRNA模型预测患者5年总生存率的ROC曲线下面积为0.893。热图显示该模型中各lncRNA基因表达水平在高风险组和低风险组患者间有一定差异。结论依据筛选的lncRNA构建的预后风险模型可较好评估神经胶质瘤患者预后,这些lncRNA有望成为神经胶质瘤预后相关的新候选生物标志物。