马启华
(昌吉州人民医院网络信息管理中心;831100)
【摘要】:目的:解决海量的数据用传统统计手段无法无法有效的地宏观分析的问题。方法:依赖数据挖掘技术解决了这一问题,结果:数据挖掘技术能将大批量数据背后潜藏的信息显示出来,为用户带来巨大的经济效益和社会效益。结论:数据挖掘技术随着数据库、人工智能等技术的发展,数据挖掘技术会日臻完善,必将为今后的医学管理决策、科学研究带来极大便利及效益,其必将在医学领域得到更加广泛的应用。
【关键词】:知识发现、数据挖掘、医疗领域、技术应用
【中图分类号】R2【文献标号】A【文章编号】2095-9753(2018)11-0104-01
数据挖掘又称数据库中的知识发现,是从大量的数据中,抽取潜在的、有价值的知识的过程。数据挖掘所探寻的模式是一种客观存在的、但隐藏在数据中暂时未被发现的知识。现在,随着数据库技术的不断发展及数据库治理系统的广泛应用,人们面对前所未有的信息数量,目前的数据库系统无法根据现有的数据猜测未来的发展趋势。于是,人们利用数据库存储数据,采用机器学习的方法来分析数据,挖掘大量数据背后潜藏着的重要信息和知识。这两者的结合促成了数据库中数据挖掘技术的产生和发展,实现了对数据库海量信息的更高层次的分析[1]。
一、基本概念和任务
数据挖掘的定义为:从大量数据中提取出可信的、新颖的、有效的,并能被人理解的模式的高级处理过程。其过程包含了两个任务:预测和描述。预测是指用一些变量或数据库的若干已知字段预测其他感兴趣的变量或字段的未知值;描述指找到描述数据的可理解模式。预测性方法包括统计分析、关联规则和决策树预测、回归树预测等;描述性方法主要有数据分类、回归分析、聚类、变化和偏差分析、模式发现等。
二、数据挖掘方法
数据挖掘方法是在机器学习、模式识别、统计学等领域知识的基础上共同进行的,数据挖掘方法主要有以下几种:
1.神经网络(neuralnetworks)方法[2]:神经网络是一种通过训练来学习的非线性预测模型,在机器学习中作分类器使用是很普遍的,尽管模型训练所需时间较长,但其分类精度大大高于决策树法:神经网络用于解决DM问题有着自身的优势,主要表现在:(1)分类精确且稳定性好;(2)可以使用各种算法进行规则提取。
2.关联规则挖掘方法:关联规则表示数据库中一组对象之间某种关联关系的规则,如“同时发生”或“从一个对象可以推出另一个对象”。关联规则挖掘通过关联分析找出数据库中隐藏的关联,利用这些可以根据已知情况对未知问题进行推测。
3.多层次数据汇总归纳数据库中的数据和对象经常包含原始概念层次上的详细信息,将一个数据集合归纳成更高概念层次信息的数据挖掘技术被称为数据汇总。
三、数据挖掘的特点
数据挖掘技术具有四个方面的特点:
1.处理的数据规模庞大,达到GB、TB数量级,甚至更大,通常称之为海量数据。
2.查询通常是决策制定者提出的即时随机查询,往往不能形成精确的查询要求,只是靠数据挖掘本身寻找其可能感兴趣的知识。
3.在一些实际应用中,数据变化迅速,因此要求数据挖掘系统能够迅速根据情况变化做出及时反应来支持决策的确定。由于数据不断变化,因此所发现的规则也是动态变化的。
4.数据挖掘发现的规则基于大样本的统计规则,因此,不适用于具体的某一个数据,而是当样本达到一定数值时才认为有效。
四、数据挖掘在医学中的应用
1、疾病诊断:正确的诊断对于指导病人的用药及康复显然是重要的,在临床中有些疾病错综复杂,数据挖掘的有关分类分析可以应用于疾病的诊断。
2、疾病相关因素分析:在病案信息库中有大量的关于病人的病情和病人的个人信息,包括年龄、性别、居住地、职业、生活情况等,对数据库中的信息进行关联规则分析可以发现有意义的关系及模式。JonathanC.Prather等成功地应用数据挖掘的有关理论对Duke大学医学中心的产科病人早产的3个危险因素进行了分析[3]。
3、疾病预测:确定某些疾病的发展模式,根据病人的病史预测病情的发展趋势,从而有针对性的预防疾病的发生。
4、在医疗质量管理中的应用:医疗保健领域的改革使得费用压力增加,另外一方面对医院医疗服务质量的需求也逐年增高,加上医疗服务机构的增多,使医疗及管理的质量以及费用的效益比率变得更加重要。
五、结论
数据挖掘是一个新兴的、具有广泛应用前景和富有挑战性的科技领域,在工商业产业领域己经得到了较为广泛的应用,取得了显著的经济及社会效益。但在医学领域的应用刚刚起步,尚处于摸索阶段,随着数据库、人工智能等技术的发展,数据挖掘技术会日臻完善,必将为今后的医学管理决策、科学研究带来极大的方便和可观的效益。
参考文献
[1]贺海平,李捷,贺明,基于SQLServer2005数据仓库构建与数据挖掘;中国数字医学,2008年3卷2期
[2]陈宁,陈玲,张志强,数据分析系统在医院信息系统中的应用,中国数字医学2009年4卷6期
[3]曹茂诚,田方,何及夫,龚绍荣,基于数据仓库和数据挖掘的医院决策支持系统设计,中国数字医学2009年4卷2期