简介:摘要数据采集是大数据建立的基础,对海量数据的采集必须全面、真实、适用与准确,才能使数据分析的结果具备使用价值;而数据的预选加工技术则是在采集数据后,存储数据库前,去伪存真、提炼符合统计规律的数据样本,以期望降低应用成本的有效过程。本文结合作者实际工作经验,针对大数据采集环节中的采集技术与预处理技术进行分析研究,提出观点与解决思路,以供探讨。
简介:摘要:大数据时代的到来,对数据质量提出了更高的要求。生产运维精益化管理系统( PMS)作为电力运行中重要的支撑数据来源,数据的真实性和准确性显得尤为重要。 PMS数据信息采集工作繁杂,耗费人力、物力、财力巨大,随着信息技术的发展,为 PMS数据采集工作带来了便利。