[发明专利]用于识别数据异常的方法、装置、服务器和介质在审
申请号: | 202110366765.7 | 申请日: | 2021-04-06 |
公开(公告)号: | CN113780329A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 司小婷;肇斌;杨勇;王飞;胡长建;王蕾;张伟;沈力;马俊 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/906 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100176 北京市大兴区经济技*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 数据 异常 方法 装置 服务器 介质 | ||
本公开的实施例公开了用于识别数据异常的方法、装置、服务器和介质。该方法的一具体实施方式包括:获取预设时间段内的目标数据序列;确定该目标数据序列对应的预测值;基于该目标数据序列和该预测值,提取数据特征指标;将该数据特征指标输入至预先训练的自主学习模型,生成用于表征是否存在数据异常的提示信息。该实施方式减少了人员的工作量,提升了数据异常识别的准确性。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及用于识别数据异常的方法、装置、服务器和介质。
背景技术
随着互联网技术的发展,数据规模日益增加。对于大规模数据,如何及时有效地识别出异常值对于业务系统的正常运行等方面具有重要意义。
现有技术中,往往采用人为监控数据变化或通过设置波动阈值来判断数据是否异常。然而人为监控需要投入大量人力,并且难以确保人员能够及时发现大规模数据的异常。而由于实际的场景中数据通常都会波动,采用设置波动阈值“一刀切”而进行数据是否异常的判断准确性欠佳。
发明内容
本公开的实施例提出了用于识别数据异常的方法、装置、服务器和介质。
第一方面,本公开的实施例提供了一种用于识别数据异常的方法,该方法包括:获取预设时间段内的目标数据序列;确定目标数据序列对应的预测值;基于目标数据序列和预测值,提取数据特征指标;将数据特征指标输入至预先训练的自主学习模型,生成用于表征是否存在数据异常的提示信息。
第二方面,本公开的实施例提供了一种用于训练异常分级模型的方法,该方法包括:获取训练样本集合,其中,训练样本集合中的训练样本包括样本数据特征和对应的标注值,样本数据特征基于历史时间段内的数据统计特征和时间段对比特征生成,标注值基于第一方面的方法生成;将训练样本集合中的训练样本的样本数据特征作为输入,将与输入的样本数据特征对应的标注值作为期望输出,训练得到准异常分级模型;将训练样本集合中的训练样本对应的输出值进行聚类,生成目标数目个聚类的类别对应的代表值作为等级判定的参考;根据代表值和准异常分级模型,生成异常分级模型,其中,异常分级模型用于表征数据特征与数据异常等级之间的对应关系。
第三方面,本公开的实施例提供了一种用于识别数据异常的装置,该装置包括:获取单元,被配置成获取预设时间段内的目标数据序列;确定单元,被配置成确定目标数据序列对应的预测值;提取单元,被配置成基于目标数据序列和预测值,提取数据特征指标;生成单元,被配置成将数据特征指标输入至预先训练的自主学习模型,生成用于表征是否存在数据异常的提示信息。
第四方面,本公开的实施例提供了一种用于训练异常分级模型的装置,该装置包括:训练样本获取单元,被配置成获取训练样本集合,其中,训练样本集合中的训练样本包括样本数据特征和对应的标注值,样本数据特征基于历史时间段内的数据统计特征和时间段对比特征生成,标注值基于权利要求7的方法生成;训练单元,被配置成将训练样本集合中的训练样本的样本数据特征作为输入,将与输入的样本数据特征对应的标注值作为期望输出,训练得到准异常分级模型;聚类单元,被配置成将训练样本集合中的训练样本对应的输出值进行聚类,生成目标数目个聚类的类别对应的代表值作为等级判定的参考;模型生成单元,被配置成根据代表值和准异常分级模型,生成异常分级模型,其中,异常分级模型用于表征数据特征与数据异常等级之间的对应关系。
第五方面,本公开的实施例提供了一种服务器,该服务器包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第六方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110366765.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置