简介:摘要近年来,在企业中存储空间的使用往往是惊人的,例如备份数据、文件服务器数据、虚拟化平台数据等。企业数据量不断增长和数据传输要求也不断地提高,数据中心海量的存储空间和高带宽低延时的传输要求成为当前企业网络存储区域面临了严峻挑战,重复的数据过大过多地保存在存储中,使得存储环境的资源被过渡浪费,同时影响系统的响应时间和网络带宽,如同一份的报表文件占用100M,10个用户将100M的文件存放在文件服务器的不同位置上,这样就占用1000M的空间,其中90%的存储空间被浪费掉。所有,通过数据重复删除技术,能让特定集内数据高度的冗余性得到提高,同时在大数据时代下提高存储效率和保存更多的数据资源。
简介:为了协助供电公司对用电客户的行为进行准确描述,进一步指导发电端合理、有效地调整发电策略,提出了一种基于SparkR的并行化K-means聚类算法对台区用电行为特性和用电负荷特性进行分类和分析的方法。文章通过提取南通市供电公司全量台区的用电数据,进行一系列清洗、归一化等处理后,依据台区的用电负荷曲线特性,利用R语言平台和Spark计算引擎实现K-means的并行化处理,对台区进行分类,最终得到4类不同用户及其用电特性,并结合地市的地域特性针对不同类型的负荷曲线进行了验证及分析。对典型用户的信息核验与验证结果表明,文章所提方法聚类分析结果的准确率可达95%以上。
简介:摘要目前,东莞供电局用来支撑用户对信息系统需求申报、问题处理等问题的系统为信息服务平台,而该平台目前存在的主要不足是没有对处理工单的分析及展示功能。为了改善这一不足,我局信息中心自主研发了用户行为分析系统,实现了对信息服务平台工单的分析及展示功能,本文主要工作是对该系统的数据存储进行综述。
简介:摘要客户是企业经营活动的核心,在传统观念中,供电公司作为公共事业型企业组织,肩负重要的社会责任和政治责任,由于用电客户群体庞大,涉及行业分布广泛,长期以来公司对各类客户群体均投入了大量服务资源。而随着售电侧市场的逐步开放,资本竞相进入售电市场,专业售电公司的出现势必会瓜分公司的客户群体,削夺公司利润。对用电客户来说,具有了用电选择权之后,价格和服务模式将是客户选择售电公司的重要因素。本文通过提取、融合电力营销各业务系统中2013年至今的全省用电客户档案数据,从商业角度对用电客户进行价值细分,对不同客户群体的利润贡献程度进行比较和分析,一方面为电力公司开拓市场,争取有价值的客户资源提供参考依据,另一方面对客户服务资源配置提出改进建议,提高优质客户的忠诚度和保持率。