[发明专利]基于大数据的电力信用评价方法有效
申请号: | 201611159231.2 | 申请日: | 2016-12-15 |
公开(公告)号: | CN106780140B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 黄宇腾;涂莹;陈建;王红凯;裘炜浩;孔旭锋;王庆娟;牟黎;方舟;程清;陈逍潇;季超;吴恺源;张海斌;芦明德 | 申请(专利权)人: | 国网浙江省电力公司;国家电网公司;广州佰聆数据股份有限公司 |
主分类号: | G06Q50/06 | 分类号: | G06Q50/06;G06Q30/06 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 王晓燕 |
地址: | 310007 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 电力 信用 评价 方法 | ||
1.基于大数据的电力信用评价方法,其特征在于包括以下步骤:
1)数据准备步骤,包括数据获取、数据检验、数据处理;
数据获取为:根据前期业务理解及业务调研结果,确定客户信用相关变量,从电力公司营销系统以及第三方征信系统中提取客户信用相关变量数据;
数据检验为:对获取的数据质量进行检验,包括: A)用户ID的唯一性检验:每个 ID 变量应该仅出现一次,否则需要核查原因,调整数据;B)范围和取值检验:每个变量都应该来自一个定义清晰、具有已知的或预期取值范围的字段,连续变量的值应在一定的预期范围内,而名义变量应取维表中的值;否则需要核查原因,调整数据;C)缺失值检验:检验每个字段的缺失值及其来源;D)异常值检验:异常值为显偏离数据集的观测值;检验异常值出现的原因,并相应的处理异常值;
数据处理为包括对缺失值、离群值、异常值的记录进行清洗处理以及数据的归一化处理;当数据为对应变量平均值正负3个标准差以外的数值时认为该数据是离群值,当数据明显偏离数据集的观测值则认为该数据为异常值,将离群值用3个标准差的最大值或最小值替换以调整为距离最近的正常值或直接将离群值剔除;对异常值的出现进行区别并作相应处理;将缺失值调整为某个固定值或调整为一个服从正态分布的随机值,该固定值包括均值、中间值或一个指定的常数;数据的归一化处理为第一处理方式或第二处理方式,第一处理方式为通过最大最小值将原始数据线性化的方法转换到[0 1]的范围,第二处理方式为0均值标准化,将原始数据集归一化为均值为0、方差1的数据集;
2)指标体系构建步骤,包括客户用电信用的构建;客户用电信用评价维度包括:信息质量、交费行为、用电行为;在进行数据准备与模型搭建时,对高压非居、低压居民、低压非居运用同一指标体系或相似指标体系;
信息质量指基于合约精神,要求客户真实地、实时地提供相关信息,并保证登记信息的准确性、完整性以及信息更新的及时性,是对客户在信息提供质量的信用评价,信息质量的评估包括准确性与完整性两方面;
交费行为指基于合约精神,要求客户遵守合同约定按时足额交纳电费,交费行为的评估包括交费时间、交费金额、交费渠道三方面;
用电行为指基于合约精神,要求客户合法、安全用电,不危害供用电安全、扰乱正常供用电秩序的行为;用电行为的评估包括违约用电、违法窃电的种类和次数;
3)模型构建步骤,包括以下子步骤
301)确定BP神经网络的输入节点数n;
302)应用聚类分析方法,确定BP神经网络的输出节点数k;
303)计算隐层节点数,经验公式为:,m为隐层结点数,n为输入层结点数,k为输出层结点数,α为1- 10之间的常数;
304)运用遗传算法,按神经网络生成初始权重生成BP神经网络的权重,将权值和阈值分别采用从左到右、从上到下的方法进行编号,任一组完整的神经网络权重wi相当于P个染色体,这样的染色体共有P个,即种群规模P;通过选择算子执行进化运算,选择算子的特性决定了种群的进化趋势;选择过程采用标准化几何分布排序选择;将染色体按适应值由大到小的顺序排成一个序列,然后将事先设计好的序列概率分配给每个个体,大适应值对应高选择概率,小适应值对应低选择概率;使其自适应调整搜索区域,提高其搜索能力,改善收敛性能,提高遗传算法的收敛速度;最终确定BP神经网络的权重;
4)模型验证步骤,使用收集到的电力客户样本数据,对模型进行验证,若误差值超过域值,则通过步骤3)重新修正;在对模型进行验证时,通过考察验证期客户逾期交费次数和回款时长长短在各信用等级中的分布情况来验证模型的效果;当随着信用等级的增高,各等级中逾期交费客户的占比逐渐降低、回款时长降低时认为模型合适,否则对模型进行修正;
5)模型输出步骤,电力客户数据通过模型计算结果,并按照模型的输出结果、各分段客户人数分布、供电企业实际业务需求,选择各等级区间的阈值,获得信用等级标签及信用趋势标签,信用等级标签输出将客户以高低压及是否居民划分为高压、低压非居与低压居民三组;信用趋势标签记录各时期客户信用分数,直观地展现和追踪客户信用的变动趋势,全面地刻画客户信用表现;
归一化处理为第一处理方式的公式为:
该方法实现对原始数据的等比例缩放,其中Xnorm为归一化后的数据,X为原始数据,Xmax、Xmin分别为原始数据集的最大值和最小值;
归一化处理为第二处理方式的公式为:
其中,μ为原始数据集的均值;该种归一化方式要求原始数据的分布近似为高斯分布,否则采用第一处理方式进归一化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力公司;国家电网公司;广州佰聆数据股份有限公司,未经国网浙江省电力公司;国家电网公司;广州佰聆数据股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611159231.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置