简介:摘要:数据作为与土地、劳动力、资本、技术等传统要素并列的第五大生产要素,数据要素的价值正在被社会各界广泛认可和深入挖掘。如何挖掘医疗数据要素的价值,完成数据资源化、数据资产化、数据资本化的跃迁,成为业内人士不得不面临的问题,本文将尝试分析医疗数据要素价值化的路径,并指出其面临的挑战,提出相应的解决策略。
简介:目的建立一种预处理方法,在进行医疗费用数据挖掘时,将因变量(呈偏态分布的连续性变量)转换为分类变量,从而得到更加科学合理的研究结果。方法以广东省甲型病毒性肝炎医疗费用调查取得的115例患者为研究对象,分别采用中位数的分类方法和K-means聚类的方法作为预处理方法,对医疗费用这一呈偏态分布的因变量进行分类,然后建立支持向量机数学模型,采用支持向量机进行医疗费用影响因素分析;通过比较模型的预测精度、模型收益以及影响因素的筛选结果,确定最优的预处理方法。结果115例甲肝病人甲肝总住院费用中位数为2744.69元,呈偏态分布。应变量以中位数方法分类,采用支持向量机模型筛选影响因素结果显示,对医疗费用影响最大的有7个变量(前3位为医院等级、性别、疾病类型);采用聚类分析进行数据预处理时筛选影响因素结果显示,对医疗费用影响最大的有7个变量(前3位为医院等级、住院天数、支付方式)。与中位数方法的分类方法比较,采用聚类分析进行数据预处理时,支持向量机模型结果得到的预测精度由91.30%上升到97.39%;收益图表陡峭地升高到100.00%然后渐渐变得平缓,显示模型收益更好;影响因素筛选结果更加科学合理,符合实际情况。结论聚类分析是一种优秀的数据挖掘预处理方法,具有良好的应用性。
简介:摘要卫生统计信息为制定卫生工作的方针政策、编制卫生事业的发展规划,评价卫生事业的服务质量、工作效率、经济效益与社会效益以及教学科研等提供最根本的科学依据。本文对2009年度年报、2010年9月月报及2010年第3季度医改进展监测表数据质量开展审核,旨在明确相关问题并给予改善意见。