(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111634082.1
(22)申请日 2021.12.2 9
(71)申请人 国网湖南省电力有限公司
地址 410004 湖南省长 沙市天心区新韶东
路398号
申请人 国网湖南省电力有限公司供电服 务
中心(计量中心)
国家电网有限公司
(72)发明人 肖宇 叶志 肖湘奇 胡军华
徐正义 刘小平 肖湘晨 卿曦
吴文娴 罗宇剑 黄瑞 贺星
刘谋海 杨茂涛 黄燕娇 熊德智
彭沛 邹晟 曾娟 周滨 王庭婷
陈浩 余敏琪 叶浏青 (74)专利代理 机构 长沙市融智专利事务所(普
通合伙) 43114
专利代理师 欧阳迪奇
(51)Int.Cl.
G06Q 10/06(2012.01)
G06Q 50/06(2012.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于随机森林算法的用电安全感知方法、 设
备及介质
(57)摘要
本发明公开了一种基于随机森林算法的用
电安全感知方法、 设备及介质, 通过采集用电数
据, 并提取多种指标作为特征指标输入至训练完
成的随机森 林算法模型中, 由随机森 林算法模型
中的所有决策树分别输出一个用电数据所表示
的不同用电情况的概率值, 然后取所有概率值的
平均数, 以平均数中概率值最大的用电情况作为
当前用电情况结果。 本发明提供了一个无需进行
特征筛选, 集故障电弧、 漏电、 短路判断于一体的
综合性模型。 该模型旨在快速感知判断故障电
弧、 漏电和短路现象的发生, 提升低压用户故障
感知精度, 保证低压用户生命财产安全。
权利要求书3页 说明书13页 附图4页
CN 114580829 A
2022.06.03
CN 114580829 A
1.一种基于随机森林算法的用电安全感知方法, 其特 征在于, 包括以下步骤:
步骤一, 采集用电数据, 并提取电流峰峰值、 电流幅值、 电流积分与方差、 电流峰值、 电
流功率信息熵、 电流不同频段信号比重、 电流波形因子、 电流峰值指标、 电流脉冲指标和故
障电弧过零滞留概 率指标作为特 征指标;
步骤二, 将特征指标输入至训练完成的随机森林算法模型中, 并由随机森林算法模型
中的所有决策树分别输出一个用电数据所表示的不同用电情况的概率值, 然后取所有概率
值的平均数, 以平均数中概 率值最大的用电情况作为当前用电情况 结果。
2.根据权利要求1所述的方法, 其特 征在于, 所述的步骤一中, 特 征指标中包括:
电流峰峰值: 总剩余电流峰峰值Pvdi, 为采样点i对应的上一个峰值与上一个反向峰值
之差; 总电流的峰 峰值Pvai, 为采样点 i对应的上一个峰值与上一个反向峰值之差;
电流幅值: 剩余电流的幅值Adi, 为剩余电流在采样点i时的幅值; 总电流的幅值Aai, 为
总电流在采样点 i时的幅值;
电流积分与方差: 剩余电流积分INTGdi, 为剩余电流在采样点i时刻近期一个工频周期 T
内的采样值求和; 剩余电流方差Ddi, 为剩余电流在采样点i时刻近期一个工频周期T内的采
样值求方差; 总电流积分INTGai, 为总电流在采样点i时刻近期一个工频周期T内的采样值
求和; 总电流方差Dai, 为总电流在采样点 i时刻近期一个工频周期T内的采样值 求方差;
电流峰值: 剩余电流峰度Kdi, 为电流在采样点i对近期一个工频周期T内采样值求得的
峰度; 总电流峰度Kai, 为总电流在采样点 i对近期一个工频周期T内采样值 求得的峰度;
电流功率信息熵: 功率信息熵Psei, 为电流在采样点i对近期一个周期 T内的采样值求功
率谱信息熵;
电流不同频段信号比重: 剩余电流低频段信号比重Rdl, 为低频区段: 0 ‑8kHz信号量占
总信号量的比重; 剩余电流中频段信号比重Rdm, 为中频区段: 8kHz ‑40kHz信号量占总信号
量的比重; 剩余电流高频段信号比重Rdh, 为高频区段: 40kHz ‑80kHz信号量占总信号量的比
重; 总电流低频段信号比重R al, 为低频区段: 0 ‑8kHz信号量占总信号量的比重; 总电流中频
段信号比重Rad, 为中频区段: 8kHz ‑40kHz信号量占总信号量的比重; 总电流高频段信号比
重Rah, 为高频区段: 40kH z‑80kHz信号量占总信号 量的比重;
电流波形因子: 总剩余电流波形因子Sdi, 为总剩余电流在i采样点时刻, 近一个工频周
期的均方根值与其绝对值的比例; 总电流波形因子Sai, 为总电流在 i采样点时刻, 近一个工
频周期的均方根 值与其绝对值的比例;
电流峰值指标: 总剩余电流峰值指标Cdi, 为第i个采样点时刻, 近一个工频周期的剩余
电流最大值与近一个工频周期内的剩余电流有效值之比; 总电流峰值指标Cai, 为第i个采
样点时刻, 近一个工频周期的总电流 最大值与近一个工频周期内的总电流有效值之比;
电流脉冲指标: 剩余电流脉冲指标Sdi, 为第i个采样时刻, 近一个工频周期的剩余电流
最大值与近一个月工频周期内的剩余电流绝对均值之比; 总电流脉冲指标Sai, 为第i个采
样时刻, 近一个工频周期的总电流 最大值与近一个月工频周期内的总电流 绝对均值之比;
故障电弧过零滞留概率指标: 通过长短期记忆人工神经网络, 根据历史数据序列计算
得到。
3.根据权利要求1所述的方法, 其特征在于, 所述的故障电弧过零滞留概率指标, 是通
过以下步骤得到:权 利 要 求 书 1/3 页
2
CN 114580829 A
2将当前i时刻的之前的总电流值变化数据, 输入至训练过的长短期记忆人工神经网络
模型中, 并由长短期记 忆人工神经网络模型输出当前i时刻发生故障电弧的概 率值PAi;
其中总电流值变化数据是将电流工频的一个周期内的采样点按时间顺序平均分为多
个子数据集, 并将当前i时刻之前相邻时间的子数据集作为总电流 值变化数据进行输入。
4.根据权利要求3所述的方法, 其特征在于, 所述的长短期记忆人工神经网模型络, 是
通过以下步骤进行训练的:
步骤1, 建立长短期记 忆人工神经网络模型;
步骤2, 采集历史电流数据, 以工频周期来采集数据, 并将数据分为训练集和测试集, 然
后将一个电流工频周期内的采样点按时间顺序平均分为多个子数据集;
步骤3, 将子数据集输入长短期记忆人工神经网络模型中, 从而输出i时刻故障电弧发
生的概率值, 然后采用Adam算法进行模型的权值参数优化; 重复执行步骤3, 直到训练目标
函数达到预设的极限附近, 从而完成训练;
步骤4, 将测试集输入训练完成的模型中, 若无 过拟合现象出现, 则完成对 模型的测试。
5.根据权利要求4所述的方法, 其特征在于, 所述的步骤1中, 长短期记忆人工神经网络
模型的全 连接层神经网络中, 单元个数即隐层单元数为40; 学习率设置为0.0006; 模型层数
设置为3层。
6.根据权利要求1所述的方法, 其特征在于, 所述的步骤二中, 所述的随机森林算法模
型, 是通过以下步骤进行训练的:
步骤①, 建立随机森林算法模型;
步骤②, 采集包括总电压、 总电流及总剩余电流在内的历史数据, 并进行特征提取, 获
得特征集;
步骤③, 以通过袋装法基于特 征集生成的训练集 来对随机森林算法模型进行训练;
步骤④, 然后通过袋装法基于特征集生成的测试集来对随机森林算法模型进行测试,
测试合格后即完成训练。
7.根据权利要求6所述的方法, 其特征在于, 所述的步骤 ①中, 在建立随机森林算法模
型时, 对模型进行初始化设置, 即固化模型中的决策树数量, 并固化模型的结构。
8.根据权利要求6所述的方法, 其特征在于, 所述的步骤 ③中, 所述的袋装法包括以下
步骤:
步骤1)在一个含有N个样本的历史用电数据集中, 抽取一个样本, 并标记次数j;
步骤2)复制该样本并放回历史用电数据集;
步骤3)重复步骤1)和2), 直至j与N相等时, 得到一个与历史用电数据集相同大小的自
助集customfeaturek, 用于第k个子树的训练。
步骤4)重复1)、 2)和3), 直至k与模型中的决策树数量相等时, 完成训练集的生成; 并将
历史用电数据集中未被抽取到的样本作为测试集。
9.一种电子设备, 其特 征在于, 包括:
一个或多个处 理器;
存储装置, 用于存 储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行, 使得所述一个或多个处理器实
现如权利要求1 ‑8中任一所述的方法。权 利 要 求 书 2/3 页
3
CN 114580829 A
3
专利 基于随机森林算法的用电安全感知方法、设备及介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:44:15上传分享