简介:摘要目的探讨基于随机森林模型分析内脏脂肪等级的相关指标。方法本研究为横断面研究,选取2021年3—9月在黑龙江省医院健康管理中心进行体检的医院职工(包括在职职工和退休职工)共617例的各项实验室指标以及体成分分析各项指标,按照2∶1的比例将样本分为训练集(411例)和测试集(206例),模型共纳入预测变量110个,使用训练集数据进行随机森林模型构建,测试集数据进行模型验证,选择最优节点数和决策树数目,对构建模型的预测性能进行评价,同时选取重要性在前10位的相对重要因子进行下一步的研究。按内脏脂肪等级,对617名研究对象再次进行分组:内脏脂肪等级正常组和内脏脂肪等级偏高组,进一步分析前10位相对重要因子在组间的差异。结果随机森林模型的最优节点数为39、决策树数目为300。模型在测试集上的准确率为83.3%、精确率为73.9%、灵敏度为89.4%、特异度为78.7%,其受试者工作特征曲线下面积为0.881(95%CI:0.832~0.931)。模型中前10位相对重要因子依次为:体重指数、性别、年龄、尿酸、红细胞计数、单核细胞计数、C肽、癌胚抗原、糖化血红蛋白、谷氨酰转肽酶。内脏脂肪等级偏高组的体重指数、年龄、尿酸、红细胞计数、单核细胞计数、C肽、癌胚抗原、糖化血红蛋白、谷氨酰转肽酶水平均高于内脏脂肪等级正常组(均P<0.05);内脏脂肪等级偏高的发生率男性大于女性(P<0.05)。结论本研究构建的内脏脂肪等级的随机森林预测模型表现良好,内脏脂肪与机体肝功能、胰岛功能、免疫功能的改变均有关系。
简介:摘要胆囊癌是胆道系统最常见的恶性肿瘤,根治性手术切除是目前胆囊癌唯一有效的治疗手段,但效果欠佳。识别胆囊癌患者的关键预后因素,建立一种个体化、准确的生存预测模型,对于胆囊癌患者预后评估、治疗方案选择及临床决策支持具有重要的指导意义。目前常用的肿瘤TNM分期预测价值有限;Cox回归模型是最常用、最经典的生存分析方法,但难以建立预后变量之间的关联关系。列线图及贝叶斯网络等机器学习方法近年来逐渐用于建立胆囊癌的生存预测模型,显示出了一定先进性,但模型的精确度及临床应用仍需要进一步验证。建立我国胆囊癌多中心大样本数据库,基于机器学习算法建立更精准的生存预测模型以指导胆囊癌临床决策是今后研究的主要方向。
简介:摘要目的探讨结石相关型胆囊上皮内瘤变的相关因素,并建立其预测模型。方法回顾性分析2013年1月至2018年12月于西安交通大学第一附属医院肝胆外科因胆囊结石行胆囊切除术且术后病理学检查结果提示为慢性胆囊炎或胆囊上皮内瘤变的750例患者的临床病理学资料,其中胆囊结石伴胆囊上皮内瘤变150例,胆囊结石伴慢性胆囊炎600例。男性264例,女性486例,年龄(51.3±14.5)岁(范围:18~90岁)。通过χ²检验、Logistic回归模型筛选胆囊上皮内瘤变的独立相关因素,并建立模型及进行内部验证。将原始数据按照7∶3比例随机分为建模组(526例)和验证组(224例),分别采用列线图及树增益朴素贝叶斯方法建立结石相关型胆囊上皮内瘤变的预测模型,采用一致性指数(C-index)、校准图、受试者工作特征曲线的曲线下面积(AUC)及混淆矩阵评估两种模型的预测能力。结果单因素分析结果显示,年龄、病史(年)、胆囊大小、胆囊黏膜是否光滑、胆囊壁是否增厚、结石大小及结石数量是结石相关型胆囊上皮内瘤变发生的相关因素(χ²=19.957、8.599、9.724、9.301、8.341、15.288、9.169,P值均<0.05)。多因素分析结果显示,年龄(OR=2.23,95%CI:1.50~3.31,P<0.01)、胆囊大小(OR=2.11,95%CI:1.17~3.80,P=0.013)、胆囊黏膜是否光滑(OR=1.80,95%CI:1.13~2.88,P=0.014)、结石大小(OR=2.98,95%CI:1.71~5.21,P<0.01)及结石数量(OR=2.14,95%CI:1.34~3.42,P<0.01)是结石相关型胆囊上皮内瘤变发生的独立相关因素。列线图建模组和验证组的C-index分别为0.708和0.696,两种模型建模组AUC分别为70.60%和70.73%,验证组的AUC分别为68.14%和67.47%。两种模型建模组的精确度分别为69.96%和70.72%,验证组的精确度分别为66.96%和67.41%。结论年龄、胆囊大小、胆囊黏膜是否光滑、结石大小及结石数量是结石相关型胆囊上皮内瘤变发生的独立相关因素,基于上述因素建立的列线图及树增益朴素贝叶斯模型可用于预测胆囊上皮内瘤变的发生。
简介:摘要目的运用生物信息学分析肺腺癌代谢发生发展的关键基因并构建预后模型。方法利用TCGA、KEGG、TCGA数据库筛选肺腺癌的基因表达、代谢相关基因、肺腺癌代谢相关的基因集和临床信息。采用Cox回归分析,lasso回归降维筛选预后相关基因。Cox回归构建肺腺癌风险模型,高风险与低风险组。结果成功筛选出4个基因,LDHA、GAPDH、GNPNAT1和HACD1。高风险组预后显著差于低风险组(P<0.01),根据生存时间受试者工作特征曲线,1年、2年、3年曲线下面积分别为0.64、0.637、0.645。实验和验证数据集均提示该预后模型有较好的预测能力。结论筛选4个关键基因与肺腺癌代谢相关,构建的风险模型对于肺腺癌治疗及预后判断提供依据,为肺腺癌的精准化治疗提供新思路。
简介:摘要目的为了评估核电对周围环境的辐射影响,通过模式动物精细化建模,构建剂量评估模型并确定相关剂量系数。方法针对核电液态流出物辐射危害评估中的重要水生模式生物斑马鱼,建立用以剂量估算的斑马鱼含有内部骨骼和内脏器官的几何模型。使用蒙特卡罗方法,以核电液态流出物及周围环境监测中常见的3H、40K、58Co、60Co、110Ag、134Cs、137Cs 7种核素为源项,计算斑马鱼模型的内外照射剂量系数(DC)。结果核素γ能量的高低决定了外照射剂量系数的大小。对内脏器官、骨骼和全身的外照射剂量系数比较显示,大部分核素内脏器官剂量系数高于全身剂量系数,58Co的内脏器官剂量系数比全身高165%。本研究建立模型内照射剂量系数较大,60Co造成的内照射剂量系数是已有椭球模型剂量系数的2.6倍,说明内部材料的不同和粒子种类不同的选择会影响能量沉积。结论对模式生物进行精细化建模比较重要。精确评估模式生物器官剂量系数,有助于评估非人类物种的辐射效应。
简介:摘要目的研究免疫相关lncRNA与胃癌的关系,从而探索胃癌治疗潜在的靶点。方法通过TCGA数据库收集443例胃癌患者基因表达谱数据及临床数据,筛选胃癌中与免疫相关的lncRNA,通过单因素与多因素COX分析构建预测模型。采用Kaplan-Meier法进行生存分析,ROC曲线下面积(AUC)评价该模型预测的准确性,主成分分析(PCA)分析人群分布特征,ESTIMATE方法评估样品微环境中免疫细胞变化。结果本研究共获得546个免疫相关的lncRNA(相关系数Cor>0.4, P<0.001),通过单因素COX回归分析筛选出9个和胃癌预后相关的lncRNA,通过多因素COX分析最终筛选得到6个lncRNA(AP003392.1,AL022316.1,AC005586.1,LINC01315,AP001318.2,AL161785.1)并构建预测模型,模型将胃癌患者分为高风险与低风险组,生存分析提示两组间生存存在显著差异(P<0.001),ROC分析曲线下面积AUC为0.686,ESTIMATE分析提示高风险组的免疫细胞数量和基质细胞数量多,肿瘤纯度低,免疫评分高;而低风险组的免疫细胞数量和基质细胞数量较少,肿瘤纯度较高,免疫评分低,两者具有统计学差异(P<0.001)。结论免疫相关的lncRNA对胃癌患者具有潜在的预后价值,可能为胃癌的免疫学研究和治疗提供新的思路。
简介:摘要目的鉴定和筛选胰腺癌中与免疫基因相关的长非编码RNA(lncRNA),并构建胰腺癌预后风险评估模型,探索预后相关因素。方法通过癌症和肿瘤基因组图谱(TCGA)数据库下载177例胰腺癌患者的测序数据和相应的临床病理和随访信息,采用随机数字表法将患者随机分为试验集(n=89)和验证集(n=88)。首先利用Pearson相关系数计算公式鉴定出与免疫基因显著相关的lncRNA,随后在试验集中利用单因素Cox和多因素Cox分析筛选出与预后相关的lncRNA用于构建预后风险评分公式,利用验证集数据对模型进行验证。结果Pearson相关系数计算公式筛选出788个与免疫相关的lncRNA,在试验集中利用单因素和多因素Cox分析鉴定出5个lncRNA(AC006237.1、AC025154.2、RASSF8-AS1、AL122010.1和AC073896.3)用于构建预后风险评分公式。基于预后风险评分公式将试验集患者分为高风险组(n=44)和低风险组(n=45),生存分析发现高风险组的中位生存期(1.09年)与低风险组(4.11年)相比显著缩短(χ2=26.016,P<0.001)。利用上述公式将验证集的患者分为高风险组(n=44)和低风险组(n=44),生存分析发现高风险组患者的中位生存期(1.28年)与低风险组(1.90年)相比差异也具有统计学意义(χ2=4.422,P=0.035)。单因素和多因素分析提示该预后风险评估模型可有效预测胰腺癌患者的预后情况,且可以作为一个独立的预后相关模型(HR=2.618,95%CI为1.285~5.332,P=0.008)。预后风险评估模型较常见的临床病理指标具有较好的预测效率[1年曲线下面积(AUC)=0.687,3年AUC=0.725,5年AUC=0.782],高于年龄、性别、肿瘤组织病理学分级等常见临床指标的预测能力。AC025154.2、AC073896.3、AL122010.1和RASSF8-AS1在不同临床特征胰腺癌患者中的表达差异均具有统计学意义(均P<0.05),可能是胰腺癌潜在的新型诊断和治疗靶点。干扰素α、哺乳动物雷帕霉素靶蛋白复合体1(mTORC1)、MYC相关调控基因、转化生长因子-β(TGF-β)信号通路在高风险组被显著激活,肌生成和胰腺β细胞信号通路在高风险组被显著抑制。上述信号通路可能是该预后风险模型的潜在分子机制。结论基于5个免疫相关lncRNA构建的预后风险评估模型可以有效地预测胰腺癌患者的预后情况,此外上述免疫相关lncRNA可能是胰腺癌诊断和治疗的新型生物标志物。
简介:摘要目的探讨留置带隧道和涤纶套的透析导管(tunnel-cuffed catheter,TCC)的血液透析(hemodialysis,HD)患者发生导管相关血流感染(catheter-related bloodstream infection,CRBSI)的危险因素,构建感染风险预测模型。方法本研究为回顾性研究,选择2020年7月至2020年12月于郑州大学第一附属医院血透通路中心移除TCC的HD患者为研究对象,按照7∶3的比例随机分为训练集(用于模型建立)和验证集(用于模型验证)。参照2019年肾脏病预后质量倡议血管通路临床实践指南CRBSI诊断标准,将训练集分为CRBSI组与非CRBSI组,分析CRBSI发生的危险因素。应用多因素Logistic回归分析中变量的比值比(OR)值构建风险预测模型,在验证集中验证该模型的评估能力。结果共纳入254例HD患者。训练集179例,男女比例为1.36∶1,年龄(55.81±15.95)岁,中位透析龄18(8,27)个月,中位TCC留置时间15(5,24)个月,确诊CRBSI的HD患者有40例。多因素Logistic回归分析结果显示,合并糖尿病(OR=2.711,95% CI 1.174~6.258,P=0.019)、3个月内导管相关感染史(OR=3.674,95% CI 1.541~8.760,P=0.003)、1个月内护理干预≥4次(OR=3.128,95%CI 1.343~7.283,P=0.008)和中心静脉病变(OR=2.572,95%CI 1.130~5.854,P=0.024)是HD患者发生CRBSI的独立影响因素。应用多因素Logistic回归中变量的OR值取整转化为风险模型的赋分值,在训练集中将各个因素对应的分值相加得到风险评分,绘制受试者工作特征曲线(ROC曲线),ROC曲线下面积(AUC)为0.761(0.683~0.839),最大约登指数为0.461,此时对应的截断值为6分,敏感度为90.0%,特异度为56.1%;在验证集中验证该模型,AUC为0.794(0.674~0.914),截断值为6分时,敏感度为61.6%,特异度为82.5%。结论合并糖尿病、3个月内导管相关感染史、1个月内护理干预≥4次和中心静脉病变是CRBSI发生的独立危险因素,基于以上因素建立的风险预测模型对CRBSI预测具有良好的效能,可为HD患者发生CRBSI的防治提供指导。
简介:摘要目的探讨基于生物信息学方法构建免疫相关基因(immune-related genes,IRG)预后模型以准确预测喉癌患者的预后。方法从癌症基因组图谱(the Cancer Genome Atlas,TCGA)数据库获得111个喉癌组织和12个正常相邻组织之间的差异表达基因(differentially expressed genes,DEG)。利用ImmPort数据库识别出差异表达的IRG。Cox单变量生存分析用于筛选与生存相关的IRG。差异表达的与生存相关的IRG被认为是预后相关的免疫基因。然后构建免疫基因预后模型计算患者风险值,受试者ROC曲线分析验证模型准确性。通过该模型行单因素、多因素独立预后分析证明其独立预测能力。最后分析关键免疫基因与临床病理参数的关联。结果鉴定喉癌的DEG并筛选出IRG。接着与预后生存时间结合,鉴定8个关键免疫基因(CXCL11、RBP1、AQP9、CYSLTR2、BTC、STC2、UCN和FCGR3B)作为免疫基因预后模型,这种预后模型可以准确的将患者分为高危和低危人群。总体生存分析表明,高危患者的生存时间比低危患者要短(P<0.0001)。模型的ROC曲线下面积为0.810,提示预后模型具有较高的敏感性和准确性。单因素和多因素Cox回归表明其为喉癌患者预后的独立预测因素。此外,我们发现模型中的5个关键基因与临床病理特征显著相关。结论基于生物信息学方法构建喉癌的免疫相关基因预后模型,发现8个基因有助于预测喉癌患者的预后,其中5个与临床病理特征显著相关。
简介:摘要目的在不同孕前体重指数(BMI)分层的妊娠妇女中,通过孕中期的糖脂代谢指标建立巨大儿的风险评估模型,并探讨该模型的价值。方法为单中心、大样本的回顾性研究。收集2016年9月至2018年12月在北京协和医院产科门诊孕24~28周进行常规口服75 g葡萄糖耐量试验(OGTT)的孕妇共1 781例,排除孕前糖尿病合并妊娠、高血压、甲状腺功能异常、肝肾功能疾病及多胎妊娠后,最终入组1 114例,按照孕前BMI分为体重正常组(940例,BMI<24.0 kg/m2)和肥胖或超重组(174例,BMI≥24.0 kg/m2)。记录不同体重组患者的一般资料、孕期糖代谢状态资料,记录妊娠结局。采用单因素logistic回归分析寻找巨大儿发生的独立危险因素,采用二元logistic逐步回归建立巨大儿预测模型,采用受试者工作特性(ROC)曲线评估预测模型价值并寻找相应预测切点。用PROCESS 3.4进行中介分析。结果与孕前体重正常组相比,孕前超重或肥胖组发生巨大儿风险更高(OR值为2.72,95%CI 1.75~4.23)。调整混杂因素(包括妊娠年龄、糖尿病家族史、不良孕产史)后,孕中期的空腹血糖(FPG)、餐后1 h血糖(1hPBG)、妊娠期糖尿病(GDM)、甘油三酯(TG)、载脂蛋白B(ApoB)、孕重增加(GWG)均是巨大儿发生的危险因素,高密度脂蛋白胆固醇(HDL-C)是保护因素(均P<0.05)。二元logistic逐步回归法建立巨大儿预测模型,孕前体重正常组共940例,最终纳入预测指标为孕中期的GWG、ApoB及TG/HDL-C;孕前超重和肥胖组174例,最终纳入预测指标为ApoB和TG/HDL-C。孕前体重正常组预测巨大儿ROC曲线下面积为0.841,灵敏度为82.3%,特异度为75.2%;超重或肥胖组ROC曲线下面积0.727,灵敏度仅为50.0%,特异度为97.3%。在2组中,TG/HDL-C作为中介变量,在血糖和巨大儿的关系里中介效应显著。结论孕中期ApoB、TG/HDL-C联合GWG建立的巨大儿预测模型有较好的区分度和准确性,尤其在孕前体重正常的妊娠妇女中,提示血脂代谢紊乱对巨大儿的发生可能起着决定性作用。
简介:摘要经外周静脉置入中心静脉导管(PICC)引发的导管相关性静脉血栓(PICC-RVT)是置管患者最严重的并发症之一。肿瘤患者PICC-RVT发病率高,是导致非计划性拔管的首要原因,不仅增加了住院费用、还延长了住院时间。PICC-RVT可防难治,转变既往"重治疗、轻预防"的临床思维,开发针对肿瘤患者的PICC-RVT风险预测模型,可提前评估患者的血栓发病风险,有助于PICC-RVT的分层防治,降低PICC-RVT发病率并改善其不良结局。本文就国内外已发表的PICC-RVT风险预测模型展开综述,为临床医护人员基于各专科病种特点选择合适的血栓风险预测工具提供参考。
简介:摘要目的筛选与结肠癌预后相关长链非编码RNA(lncRNA),并构建结肠癌预后风险模型。方法数据提取时间:建库至2022年3月1日。从癌症基因组图谱(TCGA)数据库下载并整理结肠癌转录组数据,构建配对样本lncRNA表达矩阵,利用“edgeR”R包筛选获得差异表达lncRNA(DElncRNA)。对DElncRNA先后行COX回归模型单变量分析、Lasso回归分析、Kaplan-Meier(K-M)生存分析、多元COX回归模型分析,获取预后相关lncRNA。依据多元COX回归模型中回归系数构建结肠癌预后风险模型。通过C指数值、时间依赖的受试者工作特征曲线(ROC)和ROC下的面积(AUC)及K-M生存分析评估模型预测的准确性。对模型中lncRNA构建竞争性内源RNA(ceRNA)网络,对相关的mRNA进行基因本体论(GO)、京都基因与基因组大百科全书数据库(KEGG)富集分析,探索lncRNA影响结肠癌进展的机制。结果整理转录组数据得到5 460个lncRNA,配对样本分析获得DElncRNA 868个,其中上调548个、下调320个。单变量COX回归分析后获得40个lncRNA,经Lasso回归分析过滤共线性因素,得到lncRNA 34个,K-M生存分析后,得出14个候选lncRNA。再进行多元COX回归分析,得到7个预后相关lncRNA(下调:LINC01132;上调:ELFN1-AS1、RP5-884M6.1、LINC00461、RP1-79C4.4、RP4-816N1.7、RP3-380B8.4),依据回归系数构建预后风险模型。模型的C指数值为0.82;3年和5年的AUC值分别为0.79、0.84;进行K-M生存分析提示高低风险组生存率差异有统计学意义(P<0.000 1)。随后构建ceRNA网络,通过KEGG富集分析提示下调lncRNA可能是通过肌动蛋白细胞骨架的调控、癌症中蛋白聚糖、PI3K-Akt信号通路等抑制结肠癌进展,上调lncRNA可能是通过细胞粘附分子、局灶性粘连、吞噬体等通路促进结肠癌进展。结论本研究构建了一个包含7个lncRNA的结肠癌预后风险模型,具有较好预测患者生存预后准确性,每个lncRNA是潜在单独的预后生物标志物,对临床上结肠癌患者预后评估具有一定参考价值。