简介:摘要目的探索一种利用医疗大数据算法筛选临床数据库中能够用于评估老年肺炎患者预后的核心指标。方法基于首都医科大学附属北京朝阳医院医联体朝阳急诊病房临床数据库,应用大数据检索技术,以数据库中老年肺炎患者为研究对象,根据出院时预后将患者分为死亡组和存活组。收集患者的一般资料,包括性别、年龄、血气、实验室指标集合数据,使用计算机语言Python批量计算出影响老年肺炎患者死亡的关键指标,并采用Logistic回归分析实验室指标与患者预后的相关性;绘制受试者工作特征曲线(ROC曲线),分析本研究使用的筛选方法对患者预后的预测价值。结果最终入选265例患者,死亡64例,存活201例。取每例患者入院首次检测指标的数据,最终从472项指标中筛选出23项差异有统计学意义的关键指标,包括:血常规指标7项、血气指标3项、肿瘤标志物指标3项、凝血功能相关指标4项、营养及器官功能相关指标6项。①肺炎死亡患者血气关键指标:51.6%(33例)的患者Cl-浓度为97~111 mmol/L,81.2%(52例)的患者血乳酸(Lac)为0.5~2.5 mmol/L,87.5%(56例)的患者H+浓度为0~46 mmol/L。②肺炎死亡患者血常规关键指标:46.9%(30例)的患者血红蛋白(Hb)为80~109 g/L,67.2%(43例)的患者血中嗜酸粒细胞比例(EOS%)为0.000~0.009,51.6%(33例)的患者血中淋巴细胞比例(LYM%)为0.00~0.09,50.0%(32例)的患者血中红细胞计数(RBC)为(3.0~3.9)×1012/L,54.7%(35例)的患者血中白细胞计数(WBC)为(0.0~9.9)×109/L,48.4%(31例)的患者血中红细胞分布宽度变异系数(RDW-CV)为10.0%~14.9%,48.4%(31例)的患者血中C-反应蛋白(CRP)为0.0~49.9 mg/L。③肺炎死亡患者肿瘤标志物关键指标:76.6%(49例)的患者血游离前列腺特异抗原/总前列腺特异抗原(FPSA/TPSA)为阴性(比值为0),92.2%(59例)的患者细胞角蛋白19片段(CYFRA21-1)为0.0~11.0 μg/L,75.0%(48例)的患者糖类抗原125(CA125)为0~104 kU/L。④肺炎死亡患者凝血功能关键指标:68.8%(44例)的患者活化部分凝血活酶时间(APTT)为57~96 s,73.4%(47例)的患者D-二聚体为0~6 mg/L,93.8%(60例)的患者凝血酶时间(TT)为14~22 s,89.1%(57例)的患者二磷酸腺苷(ADP)的抑制率为0%~53%。⑤肺炎死亡患者营养及器官功能关键指标:92.2%(59例)的患者B型脑钠肽(BNP)为0,46.9%(30例)的患者前白蛋白(PA)为71~140 mg/L,90.6%(58例)的患者尿酸(UA)为21~41 μmol/L,75.0%(48例)的患者白蛋白(Alb)为10~20 g/L,93.5%(60例)患者白蛋白/球蛋白比值(A/G比值)为0~0.9,84.4%(54例)的患者乳酸脱氢酶(LDH)为0~6.68 μmol/L·s-1·L-1。⑥ Logistic回归和ROC曲线分析:Logistic回归分析表明,PA和Lac是影响患者预后的因素,PA可使死亡风险降低0.9%,Lac可使死亡风险增加69.4%;实验室指标与患者死亡预测模型预测效果的ROC曲线下面积(AUC)=0.80,说明本研究使用的筛选方法效果较好,通过本研究模型能较好地预测老年肺炎患者预后。结论运用大数据技术可从急诊病房临床数据库中筛选出23项用于评估老年肺炎患者预后的核心指标,为临床评估老年肺炎患者预后提供了新的角度和方法。
简介:摘要目的进一步完善科室信息系统,建立多参数重症医学数据库,为重症医学大数据分析研究提供资料,为其他医疗机构建立相关数据库提供参考。方法在充分了解科室临床及科研工作需要的前提下,解放军总医院第一医学中心重症医学科基于重症医学临床信息系统,整合了医院信息系统(HIS)、电子病历系统(EMR)、监护信息系统(Moniter)、检验信息系统(LIS)、放射信息系统(RIS)中患者的病例资料,初步建立了重症医学数据库。在此基础上进行相关数据分析及验证;并对比重症医学监护信息数据库(MIMIC-Ⅲ)而逐步完善其内容及架构。结果在2017年9月至2020年2月重症医学临床信息系统运行期间,该重症医学数据库共纳入2 207例次重症患者的诊疗信息,包括患者进入重症监护病房(ICU)前及在ICU期间的全部数据,如人口统计学信息、生命体征、药物治疗、出入量记录、样本采集时间、实验室检查结果、手术治疗和多种临床常用评分数据及诊断等。所收集的数据按照内容不同分别储存至不同的数据表中,各表通过主键相互连接。数据库中收集的数据可经信息系统进行初步统计分析,并已经用于部分临床研究,可将临床与科研紧密结合。结论基于重症医学临床信息系统建立的重症医学数据库,可为医疗机构进行重症患者规范化治疗和临床研究提供帮助;其功能的进一步完善可以更好地适用于我国危重患者人群的数据分析。
简介:目的建立一种预处理方法,在进行医疗费用数据挖掘时,将因变量(呈偏态分布的连续性变量)转换为分类变量,从而得到更加科学合理的研究结果。方法以广东省甲型病毒性肝炎医疗费用调查取得的115例患者为研究对象,分别采用中位数的分类方法和K-means聚类的方法作为预处理方法,对医疗费用这一呈偏态分布的因变量进行分类,然后建立支持向量机数学模型,采用支持向量机进行医疗费用影响因素分析;通过比较模型的预测精度、模型收益以及影响因素的筛选结果,确定最优的预处理方法。结果115例甲肝病人甲肝总住院费用中位数为2744.69元,呈偏态分布。应变量以中位数方法分类,采用支持向量机模型筛选影响因素结果显示,对医疗费用影响最大的有7个变量(前3位为医院等级、性别、疾病类型);采用聚类分析进行数据预处理时筛选影响因素结果显示,对医疗费用影响最大的有7个变量(前3位为医院等级、住院天数、支付方式)。与中位数方法的分类方法比较,采用聚类分析进行数据预处理时,支持向量机模型结果得到的预测精度由91.30%上升到97.39%;收益图表陡峭地升高到100.00%然后渐渐变得平缓,显示模型收益更好;影响因素筛选结果更加科学合理,符合实际情况。结论聚类分析是一种优秀的数据挖掘预处理方法,具有良好的应用性。
简介:摘要卫生统计信息为制定卫生工作的方针政策、编制卫生事业的发展规划,评价卫生事业的服务质量、工作效率、经济效益与社会效益以及教学科研等提供最根本的科学依据。本文对2009年度年报、2010年9月月报及2010年第3季度医改进展监测表数据质量开展审核,旨在明确相关问题并给予改善意见。
简介:摘要:目的:分析基于TCGA数据库。方法:访问TCGA并下载与患者结肠癌相关的数据集,并获得RPE-108k3BGBD基因表达谱以及相关临床信息。分析在结肠癌中RPE-108k3BGBD基因表达情况,分析表达与临床病理学参数相关性以及对患者预后的影响。采用GO信息和KEGG通路信息进行富集分析RPE-108k3BGBD基因在结肠癌中的调控通路。结果:根据TCGA数据集可以发现,在结肠癌肿瘤中RPE-108k3BGBD基因为低表达,根据COX多因素分析表明影响结肠癌预后的独立因素包括T分期,M分析,以及RPE-108k3BGBD基因表达。RPE-108k3BGBD基因低表达样品富集到DNA复制以及细胞周期等基因集。结论:通过TCGA数据库预测结肠癌患者的临床病理学研究具有明显的价值,在可以为患者的预后生存时间进行全方面的评估,得出较为有效的结果。
简介:摘要目的探讨呼吸系统肿瘤标本的采集和保存,以及呼吸系统肿瘤标本库的建立和电子信息化管理方法。方法收集呼吸系统肿瘤组织、肿瘤旁组织、正常组织、病人的血液和从肿瘤组织中提取的核酸;建立呼吸系统肿瘤标本库相配套的信息管理系统,主要是系统化标本的采集和放置、标本使用和标本的废除管理,以及病例随访平台;对建立的数据库进行了质量监控。结果10例肺癌病人低温保存的血清CEA的监测结果显示,该肿瘤标本库标本的保存效果非常好。结论该呼吸系统肿瘤数据库内容丰富全面,能对病人大量的病例资料数据信息实现快速录入、储存、查询、浏览和统计分析,为肿瘤的临床研究提供重要信息,值得在科学研究中推广应用。