简介:摘 要:针对燃煤火力发电厂,建设基于 hadoop大数据平台的大数据中心,分析 hadoop平台的软件架构、硬件架构、资源管理、功能、大数据的应用内容等,以提高火电企业数据全过程标准化管理能力,增强数据的挖掘、分析和预测能力,提高企业对大数据资产的利用效率。结果表明,典型的工业大数据平台系统架构包括监控设备、数据采集、数据存储、数据管控和数据服务。 hadoop大数据架构包括底层基础层、存储层、统一管理层、计算引擎层、能力服务层、工具及增强、应用及接口,共计七个部分。大数据技术的应用包括计算密集型应用,输入、输出的密集型应用,分布式存储与大规模并行计算,实时数据处理与查询分析,数据整合,数据使用,数据服务,数据治理。大数据的治理的内容包括数据采集、数据交换、数据存储、数据清洗、数据查询、数据加工、审计、数据溯源、元数据标记与发现、数据生命周期管理等。