370982198501160031
370982197107074712
摘要:随着信息化深入发展,数据已经成为一种战略性资源,能够掌握足够多的数据是企业发展壮大的标志。而数据挖掘技术由于其具备高效研究、分析、汇总数据的功能,在水利工程管理中备受关注,同样在我国科研领域也占据举足轻重的地位。近年来,随着水利工程在我国不断兴建应用,整个水利工程事业的发展走向直接取决于数据挖掘技术是否持续更新和优化。但是,目前水利水电工程建设中的数据挖掘技术仍旧存在许多技术难题,文章除将系统的研究数据挖掘技术在工程管理中的应用之外,还对数据挖掘技术在水利工程应用中存在的各种技术难题进行了分析,以期为后续水利工程事业的良性发展提供一些理论基础。
关键词:水利水电工程;建设;数据挖掘技术
引言
随着时间的推移,水利水电工程建设已经开始影响人类的社会生产生活,水利水电工程能否有效地服务于社会主要取决于水利工程的管理效果。因此,近年来人们在水利工程管理中做出了大量的研究和调整,以给水利工程建设注入新鲜血液,便于水利工程更好地服务社会。所以,文章系统的阐述和分析了数据挖掘技术的实施要点并探讨了其运用的可操作性,以期能为后续研究数据挖掘技术提供借鉴。
1数据挖掘技术的底层逻辑
从应用层面来看,通过数据挖掘技术与信息应用管理实现一对一的处理过程,其从大量数据中进行分析,将杂乱、残缺、错误的数据信息通过数据挖掘技术进行比对分析,整理出有序、完整、高价值的信息数据。企业可以参考这些信息数据,去分析企业经营中存在的问题和未来发展方向,从全面客观的角度,为企业决策提供强有力的判断依据。基于数据挖掘技术目前的发展情况和数据收集分析的特点,可分为两种类型的数据,即记录叙述型和推理判断型。其中的记录叙述型的数据挖掘技术主要是发现和整理数据,从企业发展产生的大量数据中获得能够高度概括企业情况的信息数据;推理判断型的数据挖掘技术主要是从所提供的信息数据中进行分析,为企业发展中的不足提供数据表述。相较于记录叙述型,推理判断型的数据挖掘技术对企业发展拥有更好的参考价值。在应用数据挖掘技术时,需要有可供分析整理的相关信息数据,所以拥有大量的数据信息已是企业的重要战略资源。采用多元化的数据分析算法,对数据进行收集分析,将这些分析结果反馈给管理信息系统,为数据维护,操作优化等方面提供助力。
2数据挖掘的实施步骤
数据挖掘技术的实施步骤共分为八步,需要按照顺序依次进行:
2.1收集信息
收集信息前,务必要充分掌握项目的目标和需求。也就是说收集信息要清楚其信息的特征,恰当的选择收集信息的方法,待信息收集完成后录入到数据库中并保存即可。
2.2数据集成
收集到的数据通常来源不同,格式不一致,性质特点也不相同,将这些数据统一进行物理整理或者逻辑汇总,这一过程即被称为数据集成。
2.3数据规约
预先处理数据源为提高数据挖掘效率的操作被称之为数据规约,对于有限的数据进行多个数据挖掘算法时,若数据源不进行预先规约,耗时会较长,若对于大量数据而言,其效率将会大幅降低。运用数据规约后就可以显示数据源的规约表示。两者相比,数据的完整性几乎一致,数据挖掘的结果基本相同;在容量方面,数据源规约集成体积小,可以大幅提升挖掘的效率。
2.4数据整理
数据库中的数据有时存在表示方式不相同或者数据的属性值不完整的情况,这时就需要用科学的方法填补丢失的数据,再通过对这些数据进行加工,确保数据库数据的完整和一致性。
2.5数据变换
参与数据挖掘的数据需要经过数学及统计学手段进行转换,这有利于挖掘数据。
2.6数据挖掘
主要基于统计学、模式识别、数据库、可视化技术、遗传算法等,高度自动化的分析处理数据库中的数据,并做出归纳性的整理。
2.7模式评估
为了挖掘出有用的数据,需要聘请专家反复评估、提取数据。
2.8成果表示
数据挖掘的成果需要通过专业的方法保存、传递和输出、共享。
3水利水电工程建设中的数据挖掘技术
数据挖掘技术在水利水电工程建设中的的应用途径GIS系统,又称之为地理信息系统,新型产业系统的新式技术当属于数据挖掘系统与地理信息系统的结合。
空间数据储存库是一项挑战性极高、意义非凡的科研项目,对数据挖掘技术和地理信息系统都具有里程碑的意义。在工程建设中之所以会用到空间数据储存库,主要是由于它可以大大提高系统处理的时效性,同时还可以独自分析数据源的系统空间数据并进行汇总处理信息数据。水利工程的管理系统中,灾情、气候、雨水、洪涝等数据库均会直接或间接影响数据源,系统数据通常会存在不统一和特定性的情况,为了使数据信息的挖掘应用和分析检测更便捷,则需要备份原始数据。在后续的数据挖掘过程中,数据源的数据格式的统一,可以快速地挖掘出期望数据,最终可以高效、自动地处理分析数据信息,为有效汇总和评估灾情数据奠定一定的基础。在空间信息数据库中进行数据挖掘分析时,数据挖掘技术搭配GIS系统,形成一个完整的新型综合产业数据系统。该数据系统兼备了两者分析数据的技术优势,即使面对海量的数据源系统进行数据挖掘时,其数据处理难度和工作量也会大大降低。当然,该综合数据系统还是存在一定的弊端,比如容易限制客户的使用需求,由于该系统只能应用于对应的GIS系统中,所以该系统并不能满足100%客户的使用需求,因此在后续的发展中也受到了局限。
数据挖掘技术与GIS系统融合的契机是数据挖掘系统与GIS系统具有相互独立的优势,同时还存在相互依存的关系。数据挖掘系统侧重从已有的各种信息数据库中汇总、分析、挖掘新的信息资源,而GIS系统则侧重为信息数据的挖掘提供充足海量的空间信息数据资源。松散耦合式模型的提出,意味着数据挖掘技术不再会限制客户的使用需求,因此,它具有更广泛的适用性和普遍性。然而松散藕合式在数据挖掘系统中的运用也存在一定的不足,比如说,应用于某些需要构建的水文模型上时,虽然可以系统全面的处理信息数据,但在实际操作中处理数据的过程较为烦琐、工作量较大、对技术要求也非常高。相对于松散耦合式,还存在另一种新型产物,即嵌入式与松散耦合式的完美结合,其取之两者的优势,具有非常高的灵活度,不仅可以采用GIS系统充分汇总处理信息数据、降低难度、缩减工作量,还充分满足了客户使用需求避免受到限制。
在水利工程管理中,许多需要分析处理的数据由于其具有独特性和不统一性,因其本身具有工程数据,处理过程较为复杂;其次还有不定时影响水文因素的数据。文章中分析了几种不同的数据分析方法以及详细的操作步骤,但是在工程的实际应用中依旧存在实施难度和局限。所以,在水利工程中的数据挖掘,GIS系统一定要充分结合利用,使其可以高效地准确挖掘处理空间数据信息,这样不仅可以充分发挥出GIS系统潜在作用和功能,还可以使水利工程管理系统的综合性和实用性得到有效提高。
结束语
总而言之,在进行水利工程开发过程中,加强对数据挖掘技术的使用,能够切实做好水利信息的管理工作,做好程序代码的分析工作,做好水利设备故障的检测工作等,对于提升水利工程整体的开发质量起着重要的促进作用。但是当前数据挖掘技术在我国还处于发展的阶段,相关人员需要加强研究,进一步提升数据挖掘技术水平,加强数据挖掘技术在水利工程中的深入应用,从而更好地提升数据挖掘效果,更好地提升水利工程的开发质量。
参考文献
[1]吴建蓉,杨涛.数据挖掘技术在水利水电工程中的应用[J].水利水电科技进展,2022(05):129.
[2]裘明华.数据挖掘技术在水利工程安全监测管理中的应用研究[J].水利科技与经济,2021(11):127-130.
[3]阿米娜古.基于数据挖掘技术的水利工程管理探讨[J].陕西水利,2018(S1):179-180+185.