摘要:首先分析、整合了用户电量数据,然后对用户用电框架进行分析整理,并基于云计算的聚类算法对用户用电数据进行智能研究,得出了用户用电分类的特征选择以及权重计算。然后基于分类特征进行了非介入式用电负荷分解与识别研究,从分解与识别原理着手设计了模型,从模型出发分析了模拟结果,证明基于云计算的聚类算法的用户用电行为分析模型是行之有效的。
关键词:用户用电行为;云计算;聚类算法;用电负荷分解
中图分类号:TM714 文献标识码:A DOI编码:10.14016/j.cnki.1001-9227.2016.02.187
0前言
我国用户的用电量对着经济社会的快速发展而呈现出快速增长的态势,往往还伴随着多元化用电需求的产生,电力供应与日益增长的节能减排、环境保护要求之间的矛盾也逐渐显现出来,所以有必要对用户用电行为进行分析,以便提供更安全、优质以及清洁的电力服务给用户。近年来,在电力用户分类方面已经有一部分学者展开了相关的研究,冯晓蒲[1]等基于传统行业划分,对用户进行聚类分析研究,但其不足之处在于忽略了用户间不同的用电方式;王璨[2]等主要从用户价值体现方面进行分类,不足之处在于划分方式过于宏观;李培强[3]等从变电站负荷出发,采用均值聚类方法进行用户用电的分类,该方法效果较好;阮文骏[4]等也针对电价进行研究,但并未把用户分类差别考虑在内。本文从先分析和整合了用户用电量的相关数据,然后基于云计算的聚类算法进行用户个性化分类研究;并在此基础上设计模型进行非介入式用电负荷分解与识别研究,以期挖掘出用户类型,帮助电网公司制定相应的需求相应,达到节能减排的目的。
1用户电量数据分析与整合
1.1用户电量数据分析
随着经济社会的不断进步,电力系统也得到了长足的发展,不仅接入了关键技术,还引入了相关的关键设备,随之势必也将产生海量的用户电量信息数据[5]。以现在的小区为例,用户的用电信息历史数据主要包含以下类型:家庭地址、单元门号等家庭基本数据信息;电表序号、居民用电量以及电量抄记日期等用户用电信息采集数据;天气、温度等相关环境数据;家电类别、用电量与用电时长等家居数据。假设有100万户家庭,仅仅一天产生的数据量就高达将近60GB的数据。本文希望能采用数据挖掘技术,从这些存储的海量数据中把其中更高价值的知识挖掘出来。
1.2用户电量数据整合
在整合用户电量信息数据时,本文以用电量为指标,建立了用电基本数据表、用电设备表以及用户信息表,分别从用电时长、用电家居信息以及用户数据方面存储并整合采集到的用户电量信息数据,为数据挖掘的开展提供数据基础[6]。用电基本数据表包括电表序号、设备ID、用电时长以及总用电量,据此可以建立数据仓库模型;用电设备表内容主要由设备ID、设备类型以及生产厂家等,便于对用户需求的进一步分析;用户信息表主要用来存储用户基本信息,其中的用户ID号与用电基本数据表中的电表序号相对应。
2用户个性化分类研究
2.1用户用电框架分析
本文在对用户用电信息数据进行个性化分类时,采用的是云计算与聚类算法并行的技术。在聚类算法中,本文选自了非常经典的K-means划分方法,在大规模数据聚类中,该算法具有高效的特点[7]。本文在对用户用电行为进行分析时,主要采用图1所示的框架图,包含以下三个模块的内容:数据采集、数据处理以及行为分析。数据采集主要是采集不同地点用户不同设备的用电信息数据;数据采集结束之后集中传输到云数据处理,进行数据的存储和管理,奠定最后分析用户用电行为的数据基础。
2.2基于云计算的聚类算法研究
传统的K-means算法步骤为:选取数据集中的数据赋给初始的聚类中心;计算样本点与聚类中心之间的欧式距离,进行获取该样本点的所属类别;重新计算聚类中心;重复上述两个步骤,直至准则函数收敛。而基于云计算的K-means算法更有助于大规模数据的开发和并行处理,不仅更可靠,而且还具备高效和扩容能力强的特点。其中的云计算平台是由分布式文件系统以及计算模型组成,通过前者可以把海量的信息数据存储在数据库中,后者可以提供类SQL接口对数据进行高效分析。并行K-means算法共包括初始类别、层次合并以及重新标记三个阶段:初始类别阶段通过计算模型处理输入数据集,并生成中间集合,并在中间库中存放运算结果;层次合并阶段是在本地将上阶段处理的数据实行层级合并,归类对应键的相同值;重新标记阶段是新中心店坐标的获得阶段,并在云计算平台的文件系统中更新阶段,并继续迭代至算法收敛。
2.3特征选择及权重计算
聚类的基础是在数据集合中相似性搜索出不同的数据对象,寻求得出数据间的相似程度,所以聚类算法在一定意义上来说也是相似性测度,只不过该相似度测度可信度更高、更为可行,形式更为新颖。本文选用的用户用电数据一方面用于用户家庭用电量的管理,另一方面提供给电力系统决策使用,所以在采集到的用户用电信息数据中,本文选取了峰时耗电率、负荷率、谷电系数以及平段的百分比四个特征。根据选取的特征用行向量矩阵来表示评价对象,并基于熵权法把特征项的指标权重计算出来,进而计算得出权重矩阵,对权重矩阵进行标准化处理之后,就可以根据得出的标准状态矩阵完成用户用电数据的分类。
3非介入式用电负荷分解与识别研究
3.1模型设计
本文设计的非介入式电力负荷分解模型主要用来完成两项任务:用电设备工作状态的检测和辨识;按照设备或设备类分解负荷总耗电量。其中式(1)和(2)分别是在t时刻的用电总负荷的有功总功率以及无功总功率,式(3)中变量表示电器的工作状态,是布尔型变量。值得注意的是,在该模型中,前两个公式的PL(t)和QL(t)都是已知量,是由实际中实测得到的;用电负荷分解的目标是每个用电设备的有功功率和无功功率;工作状态监测和辨识的目标是用户每个用电设备的工作状态标志;用电负荷分解的目标以及工作状态监测和辨识的标志均为未知量;用电设备在t时刻仅能表现出一种工作状态,还有总负荷不存在用电设备的情况,所以式
3.2分解与识别原理
对模型求解是为了估计用电设备功率和辨识用电设备工作状态。当已知用电设备工作状态时,常用分解法和差量估计法估计用电设备的用电功率,其中分解法是由公式直接估计每种用电设备的用电功率,差量估计法是在满足一定条件的基础上,由单位时间内的负荷功率变化量对用电设备的用电估计进行估计。辨识用电设备工作状态时,要明确LS是由何种工作状态产生的,还要确定在当前的用电总负荷中趋势有LS集合的一个子集存在。对于不同类型的LS,其处理思路和方法往往有所不同,本文不再赘述。
4模拟结果与分析
4.1指标定义
在对检测性能进行评价时,本文选用了以下指标:在估计用电设备的用电功率时,用到了功率检测绝对误差、功率监测相对误差以及功率监测绝对值,这些每一项指标都分为有功功率误差以及无功功率误差;在辨识用电设备工作状态时,用到了用电设备的准确辨识率、漏检率、错检率以及用电设备工作状态赚准确辨识率。
4.2模拟结果分析
本文选定某小区的600户用户作为实验数据来源,首先采集了用户的用电信息数据,然后运用并行K-means算法完成用户的分类。根据用电规律来看,共可分为五类如表1所示,分别命名为空置房用户(A类)、老人家庭(B类)、上班族家庭(C类)、老人+上班族家庭(D类)以及商业用户(E类),其中A类用户的特点是用电量较低,波动不明显;B类用户的特点是白天用电量稳定,用电量下降趋势出现时段较早;C类用户的特点是有明显的波峰和波谷的用电量,夜晚用电量较多而且用电量下降趋势出现时段较晚;D类用户的特点是B、C两类用户特点的综合;E类用户全天都处在较高用电量的状态。本文还针对实际情况与聚类结果进行比对,发现所用聚类算法达到了90%以上的准确率,究其原因,主要是不管是哪一类用户,都可能会在某一时段改变用电规律。在非介入式用电负荷分解与识别模型中,用电设备的工作状态不同时,其用电负荷分解通常也有所不同,本文选取了典型家电,组合了多种组合的用电设备在工作状态不同时的测试结果。结果表明,模型能很好地把不同用电设备处在何种工作状态辨识出来,而且能较为准确地辨识出功率相近用电设备的不同的工作状态;对于综合型负荷的用电设备,要综合考虑其有功和无功模型,准确地把用电负荷进行分类;当用电设备功率和电流模式相近时,容易导致辨识错误。综合来看,该模型适用于用户电力负荷的分解,可以在工业或商业中使用。
5结论
随着经济水平的不断提高,用户用电需求和用电量也有所提高,同时用户用电信息数据也随着关键技术和设备的引入而有所增加。本文基于海量的用户用电信息数据,对用户用电行为进行了分析研究。在云计算平台基础上探讨了并行K-means算法,综合提出多个电力特征,通过特征权重的计算,对用电用户进行分类,实际情况与聚类结果进行比对,发现所用聚类算法达到了90%以上的准确率。同时还构建了非介入式用电负荷分解与识别模型,从分解与识别原理着手设计了模型,从模型出发分析了模拟结果,能很好地把不同用电设备处在何种工作状态辨识出来,适用于用户电力负荷的分解,证明基于云计算的聚类算法的用户用电行为智能分析模型是行之有效的。
参考文献
[1]冯晓蒲,张铁峰.基于实际负荷曲线的电力用户分类技术研究[J].电力科学与工程,2010,26(9):18-22.
[2]王璨,冯勤超.基于价值评价的电力用户分类研究[J].价值工程,2009(5):64-66.
[3]李培强,李欣然,陈辉华,等.基于模糊聚类的电力负荷特性的分类与综合[J].中国电机工程学报,2005,25(24):73-78.
[4]阮文骏,王蓓蓓,李扬,等.峰谷分时电价下的用户响应行为研究[J].电网技术,2012,36(7):86-92.
[5]孙燕花,李杰,李建.基于CURE算法的网络用户行为分析[J].计算机技术与发展,2011,21(9):35-38.
[6]王轶,达新宇.分布式并行数据挖掘计算框架及其算法研究[J].微电子学与计算机,2006,23(9):223-225.
[7]赵玉艳,郭景峰,郑丽珍,等.一种改进的BIRCH分层聚类算法[J].计算机科学,2008(3):
作者:庄绪强 单位:陕西青年职业学院