第 49 卷 第 15 期 2021 年 8 月 1 日 电力系统保护与控制 Power System Protection and Control Vol.49 No.15 Aug. 1, 2021 DOI: 10.19783/j.cnki.pspc.201263 电压暂降源异质堆叠集成学习识别法 汪 颖,陈春林,肖先勇 (四川大学电气工程学院,四川 成都 610065) 摘要:电压暂降源分类识别存在可获得信息不完备的问题。针对现有单一识别法弱学习特点和组合识别法一致性 强的问题,提出一种基于异质堆叠集成学习的暂降源识别方法,提升识别模型的泛化能力和鲁棒性。把线路故障 分为普通故障和雷击故障,以10类单一电压暂降源的识别为目标,选取9个表征特征差异的波形统计参数,构建 27维识别特征向量。引入堆叠集成算法,以5种差异性强的单一识别法为基分类器,用随机森林法作元分类器,建 立异质堆叠集成识别模型。通过PSCAD仿真数据和实测数据验证,并与现有6种识别法比较,结果表明,该方法识 别精度高,噪声鲁棒性良好,具有良好的工程实用性。 关键词:电压暂降源识别;异质性;差异性;堆叠集成;识别精度;噪声鲁棒性 Heterogeneous stacking integrated learning identification method for voltage sag sources WANG Ying, CHEN Chunlin, XIAO Xianyong (College of Electrical Engineering, Sichuan University, Chengdu 610065, China) Abstract: The classification and identification of voltage sag sources has the problem of having incomplete information. Given the weak learning characteristics of the existing single identification method and the strong consisten combined identification method, a sag source identification method based on heterogeneous stacking ensemble learning is proposed to improve the generalization ability and robustness of the recognition model. Line faults are subdivided into common faults and lightning faults, and ten types of single voltage sag sources are used as the identification target. Nine waveform statistical parameters that can characterize the differences are selected to construct a 27-dimension recognition vector. The stacking ensemble algorithm is introduced, five highly differentiated single recognition methods are used as base-classifiers, and random forest is selected as the meta-classifier to establish a heterogeneous recognition model. Through the verification of a PSCAD simulation model and measured data, and comparison with six typical sag source identification methods, it is shown that the proposed method has high identification accuracy and good anti-noise performance with good engineering value. This work is supported by the National Natural Science Foundation of China (No. 51807126). K e y w o r d s :v o l t a g e s a g s o u r c e i d e n t i f i c a t i o n ; h e t e r o g e n e i t y ; d i f f e r e n c e ; S t a c k i n g i n t e g r a t i o n ; i d e n t i f i c a t i o n a noise robustness 0 引言 电压暂降造成巨大损失[1-4],已成为社会热点。 通过识别暂降源,确定更有效的解决方案,是解决 电压暂降问题的必然要求。在仅有暂降幅值、频次 等有限信息情况下,暂降源识别面临信息不完备问 题,现有识别方法多为异质弱学习模型,研究多异 质集成强学习暂降源识别方法,具有重要理论价值 基金项目:国家自然科学基金项目资助(51807126) 和现实意义[5-6]。 国内外对暂降源识别开展了大量研究[7-18],主要 有单一法和组合法,重点研究特征提取和分类识别 算法 [7-8]。特征提取法 包括小波变换 [9]、S变换 [1 0 11] 、希尔伯特黄变换[12-13]等。单一分类识别法有相似 度匹配[14]和分类器识别[10-13,15-18]两大类。前者通过距 离矩阵,按相似度进行识别;后者采用支持向量机 -2- 电力系统保护与控制 、决策树[12-13]、极限学习机[16]、神经网络[17-18] 等算法,通过样本训练识别模型。这些方法无论如 何改进,在信息不完备情况下,均呈弱学习特点, 通过集成学习可弥补此不足。国内外提出了自助法 自助聚合(Bagging)、随机森林、提升法(Boosting)、 堆叠法(Stacking)等集成学习法,考虑多弱学习模型 的偏置、方差等,建立有强学习特点的集成模型, 提升识别性能,更符合暂降源识别的实际。 自助法、自助聚合(Bagging)、随机森林、提升 法(Boosting)、堆叠法(Stacking)等集成学习法均为组 合识别法,现有暂降源单一识别法的不足是,不同 场景下识别误差大,可能出现过拟合,泛化能力不 足[19-20]等,可通过异质堆叠集成学习解决这些问题。 本文以27维暂降波形特征为依据,以10类单一 暂降源为目标,选取5种异质识别模型,用随机森林 (RF)法作元分类器,提出一种异质堆叠(Stacking)集 成暂降源识别法。通过仿真和实测数据验证本文方 法,并与现有6种方法比较,结果表明,本文方法具 有识别准确度高、噪声鲁棒性好等优点,工程应用 前景良好。 [10-11,15] 1 暂降源异质堆叠集成识别法原理 1.1 异质堆叠集成原理 集成学习是将若干弱学习识别器集成为强学习 识别器的方法,分同质集成和异质集成。前者所用 基础识别器相同,误差相似度高;后者采用不同类 型基础识别器,准确率高,泛化能力强。 堆叠(Stacking)集成[21]一般采用两层结构,如图 1,第一层为基分类器,第二层为元分类器,集成性 能主要决定于基分类器效果和差异性。 图1 异质堆叠(Stacking)集成识别模型 Fig. 1 Heterogeneous Stacking integrated recognition model 1.2 基分类器选择 K近邻算法(KNN)、支持向量机(SVM)、梯度提 升决策树(GBDT)、极端梯度提升树(XGBOOST)、随 机森林(RF)等分类器算法的优缺点如表1。 如表1所示:KNN鲁棒性好,适合处理含噪声的 电压暂降数据,但计算复杂;而RF训练速度快,计 算简单,能弥补KNN的不足;实际电网中,变压器 激磁、电机启动等电压暂降源数量少,属于小样本 数据,SVM非常适合处理这类数据;但暂降特征维 数一般不高,引入擅长低维数据处理的GBDT算法可 提升模型精度和效率;采用XGBoost可有效防止识别 模型过拟合。综上,五种算法差异明显且各有优缺 点,符合暂降源异质堆叠集成识别要求。 表1 典型算法对比 Table 1 Comparison of typical algorithms 算法 KNN SVM GBDT XGBoost RF 特点 缺点 非参数监督,异常值不敏感, 计算复杂,易受样本 鲁棒性好 监督学习,适合小样本、非线 性及高维分类识别 影响 参数和核函数难以确定 Boosting算法类,适合低维 弱学习器之间存在依 数据,可灵活处理各种类型 赖关系,难以并行训 数据 练数据 Boosting算法类,泰勒二阶 弱学习器之间存在依 展开,防止过拟合,支持列 赖关系,难以并行训 抽样 练数据 Bagging算法类,抗过拟合能 可能存在很多相似的 力、泛化能力强,能处理高 决策树,掩盖了真实 维数据,训练速度快 的结果 2 异质堆叠识别法实现步骤 电压暂降源识别目标包括识别单相接地(S1)、两 相接地(S2)、相间短路(S3)、三相故障(S4)、雷击单相 接地(S5)、雷击两相接地(S6)、雷击相间短路(S7)、雷 击三相(S8)[13,22-23]、变压器激磁(S9)和电机启动(S10)等 2.1 特征提取 2.1.1时域特征 选取8个能够突出暂降波形差异的时域 特征 [18,24] : 均 值 FM e a n、 方 差 FS t d、 有 效 值 FR m s、 斜 度 FSkew、峭度FKur、峰值系数FCrest、波形系数FFfa和对数 能量FLe。不同暂降源引起的电压暂降会在该8个时域 特征中显示出不同的数据特点。线路故障和雷击故 障引起的电压暂降,其均值FMean会比较接近暂降幅 值;而变压器激磁和电机启动两种原因造成的电压 暂降其均值会较大程度偏离暂降幅值。 2.1.2雷击识别特征 为准确识别出雷击故障(S5—S8),需结合雷击现 象

doc文档 电压暂降源异质堆叠集成学习识别法

电力学术文献 > 故障溯源 > 其他 > 文档预览
9 页 1 下载 843 浏览 0 评论 0 收藏 3.0分
温馨提示:如果当前文档出现乱码或未能正常浏览,请先下载原文档进行浏览。
电压暂降源异质堆叠集成学习识别法 第 1 页 电压暂降源异质堆叠集成学习识别法 第 2 页 电压暂降源异质堆叠集成学习识别法 第 3 页 电压暂降源异质堆叠集成学习识别法 第 4 页 电压暂降源异质堆叠集成学习识别法 第 5 页
下载文档到电脑,方便使用
还有 4 页可预览,继续阅读
本文档由 frank2021-08-16 10:47:58上传分享
给文档打分
您好可以输入 255 个字符
电力系统保护与控制杂志社英文刊叫什么?( 答案:PCMP )
评论列表
  • 暂时还没有评论,期待您的金玉良言