关键词:大数据背景;工程造价;信息资源共享
1大数据的内涵和现状
1.1大数据的涵义
提起大数据无人不知,早在1980年,著名未来学家托夫勒将大数据赞颂为“第三次浪潮的华彩乐章”。随着互联网的应用越来越广泛,计算机应用产生的数据量呈现了爆炸性增长的趋势。在2008年《science》专刊中,大数据被定义为“代表着人类认知过程的进步,数据集的规模是无法在可容忍的时间内用目前的技术、方法和理论去获取、管理、处理的数据”。
1.2大数据的特点
大数据具有以下4个特点,即4个V:①数据体量(volumes)巨大,大型数据集,从TB级别,跃升到PB级别;②数据类别(Variety)繁多,来自多种数据源,数据种类和格式囊括了半结构化和非结构化数据;③价值(Value)密度低,以视频为例,连续不间断监控过程中,可能有用的数据仅仅1~2s;④处理速度(Ve-locity)快,包含大量在线或实时数据分析处理的需求,1s定律。
1.3大数据的国外和国内发展状况
1989年在11届国际人工智能联合会议专题讨论会上,首次提出了“数据库中的知识发现(KDD)”的概念。1995年召开了第一届知识发现与数据挖掘国际学术会议。2012年3月,奥巴马政府公布“大数据研发计划”,旨在发展收集、储存、保留、管理、分析和共享海量数据所需要的核心技术。与国外相比,国内起步稍晚,但近几年出现了蓬勃发展的态势。我国国家自然科学基金于1993年首次支持对数据挖掘领域的研究项目。1999年,在北京召开第三届亚太地区知识发现与数据挖掘国际会议(PAKDD)。2012年11月,“Hadoop与大数据技术大会”召开“大数据共享与开放技术”会议。目前,国内相关技术主要集中于数据挖掘相关算法、实际应用及有关理论方面的研究,涉及行业比较广泛,特别是在IT等领域,华为、阿里巴巴、百度等起到了很大的推动作用。
2大数据环境下的工程造价管理信息化发展对策
2.1建立统一数据标准
①要建立典型工程及数据的标准设定。包括典型工程的标准设定及编码分类、工程资料的描述规范、工程数据分类、工程数据格式、指标数据格式等,才能保证所收集数据的质量和可用度;②要加强数据标准体系的建设。建立标准的工程造价数据库体系,统一数据交换接口、软件数据导出等格式,规范技术指标、信息管理系统运行指标、维护指标和从事信息管理相关人员资质等指标体系。
2.2依托职能多途径采集集数据
造价数据库建好的关键是能够源源不断收集到有价值的数据。在项目对象上,可先从政府工程入手收集,再逐步扩展;数据阶段上,造价数据的收集还要向设计源头数据、图纸信息数据、经验数据等全过程延伸,建立诸如全国统一典型工程案例库、全国估算指标库等;也可借鉴英国BCIS系统做法,建立强制执行的各类建设项目案例采集模型或样表,收集汇总已建成的、能反映本地区、本行业建筑业发展水平的各类建设项目的工程资料,区分项目行业、工程类别等录入典型工程造价实例,经过规范处理后,存入标准的工程造价数据库,供全社会共享。
2.3搭建优质平台促进数据库建设
目前数据存储的主要模式是非关系型(NoSQL)数据库。这种数据库将海量数据存储在不同地域,不同类型的服务器中,通过服务器之间的快速信息交换,获取用户需求信息。例如百度文库,其搭建建设工程造价行业数据的混合云平台,营造了“以物换物,用户齐参与”的良好循环、互助互信数据共享环境,用户各取所需。个人和企业的力量是非常小的。建立国家工程造价数据库。数据库工作流程是通过信息技术、大数据、云计算、国家机构工程造价数据采集、各个阶段的工程造价管理、数据积累、分析、通信和应用。定期发布成本指数指标,各项建设工程(包括单项指标、综合指标、人才和机器信息指数),并利用数据挖掘进行项目成本、市场建设、固定资产投资、施工质量和安全产生影响的研究技术和相关分析等方面。国家工程造价数据库建设是工程造价管理改革的重点工作,也是造价管理组织职能转变和能力提高的关键工程。
2.4重视数据挖掘技术
数据挖掘,就是结合统计数据和机器学习,使用数据库管理技术从大型数据集中提取有用信息和知识的技术。根据其它属性的值预测特定属性的值,如回归、分类、异常检测等,或寻找概括数据中潜在联系的模式,如关联分析、演化分析、聚类分析、序列模式挖掘等。数据挖掘的焦点集中在寻求数据挖掘过程中的可视化方法,使知识发现过程能够被用户理解,便于在知识发现过程中的人机交互。数据挖掘在其服务器可以有效地实现网络环境下工程造价的有效管理和共享。通过未来运用先进的多层客户/服务器模式,可同时为网络上的工程造价提供数据挖掘服务。随着数据挖掘技术的不断完善,它可以广泛地应用到智能决策支持系统、数据仓库系统以及各种基于数据分析的辅助决策系统,为提高我国在建设项目各方(建设主管部门、业主、设计、施工、监理、审计、第三方咨询机构等)分析领域的水平,提高工程造价管理决策的水平奠定坚实的基础。
2.5建立及时有效的数据分析系统,并进行可视化研究
分析已有数据,使数据得于激活运用。比如说通过对历史造价信息数据分析测算,得出该建材的历史价格走势,形成造价指标指数,生成价格走势图,由此可以预测材料在近期的波动幅度,企业管理人员可作为成本控制的依据。枯燥的数据分析和挖掘,需要专业人士来进行。而大量的工程造价人员对于庞大复杂的数字结果,可能无法直观地理解。通过可视化技术的帮助,能够让更多的造价信息管理人员明白整个数据分析的过程,从而更好指导生产应用。所谓数据可视化,就是与信息绘图学和信息可视化相关。国内的相关造价软件和造价网站也在积极开展可视化研究,例如广联达在就在其建模过程中就可将其录入数据转换为2D,3D图形,并与其他数据相关联,便于造价人员在使用过程中直观地查看。
3结论
从大数据视角构建了基于BIM&云的工程造价信息资源共享应用框架,挖掘工程造价信息资源共享的大数据技术和数据分析方法的使用,以解决工程造价信息的数据结构,标准化的问题,对项目成本的预测模型和方法的优化和数据可视化技术示范工程造价信息的共享利用,工程造价信息资源提供了实现的途径和方法。
参考文献:
[1]方巍,郑玉,徐江.大数据:概念、技术及应用研究综述[J].南京信息工程大学学报(自然科学版),2014(5).
[2]刘贵文,李杰.基于价值管理的建筑业效率提升:海外经验及借鉴[J].现代管理科学,2008(3):24-26.