[发明专利]接口数据质量的确定方法、确定装置和确定系统在审
申请号: | 202210361932.3 | 申请日: | 2022-04-07 |
公开(公告)号: | CN114693144A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 王昊达;李冉;陈震宇;刘国华;李少波 | 申请(专利权)人: | 中国邮政储蓄银行股份有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 霍文娟 |
地址: | 100032*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 接口 数据 质量 确定 方法 装置 系统 | ||
本申请提供了一种接口数据质量的确定方法、确定装置和确定系统,该方法包括:获取多个接口在多个时间周期的接口数据质量数据;对各时间周期的接口进行聚类,得到多个第一聚类结果,一个第一聚类结果包括多个类别和各类别对应的类别中心,任意一组接口数据质量数据与对应的类别中心的误差平方和小于第一预定阈值;根据多个第一聚类结果确定各接口对应的类别;对各类别的接口数据质量数据进行聚类,得到多个第二聚类结果,一个第二聚类结果包括多个数据堆和各数据堆对应的数据堆中心,任意一组接口数据质量数据与对应的数据堆中心的误差平方和小于第二预定阈值;获取各数据堆的评分。该方法解决了现有技术中接口数据质量评分人为干预程度大的问题。
技术领域
本申请涉及软件开发技术领域,具体而言,涉及一种接口数据质量的确定方法、确定装置、处理器、计算机可读存储介质和接口数据质量的确定系统。
背景技术
目前市场与学术界存在的关于数据质量接口级别评分的现有技术方法大多是按照指标分类进行的分项打分汇总的方法,下面简要介绍一种目前的评估方法:(1)自动评分模块将数据质量问题简化为准确性、完整性和时效性三大类一级指标;准确性指标可细化为正确性、精确性、唯一性、有效性、一致性等二级指标,完整性指标可细化为数据记录填报率、数据表填报率、数据项填报率等二级指标,时效性指标可细化为数据时效性、标准时效性等二级指标;三级指标是对二级指标进一步细化后的业务评价点,三级指标是对二级指标进一步细化后的评价点,评价点往往与业务强相关,并且能够方便进行度量,如:正确性指标下关键数据项1、关键数据项2等。(2)设有m个一级度量指标,每个一级指标下有n个二级度量指标。综合度量计算公式为:式中,CER表示综合度量结果,ωi表示第i个一级指标权重,ωij表示第i个一级指标的第j个二级指标权重,Cij表示第i个一级指标的第j个二级指标的综合结果。(3)数据质量评分逻辑计算方式:给每个指标分配不同的权重分数,当某一指标出现问题时,针对问题的紧急与重要程度、问题数据量多少或问题出现比率以及延迟时间等因素,扣除指标权重的部分或全部分数。
目前使用评分公式:
接口得分(日)=100-所有指标扣分和。
系统得分(日)=Σ系统内所有接口得分总和/接口数量。
最终接口/系统得分=接口/系统得分+调整得分项。
(调整得分项包括但不限于解决问题时效、响应时间、配合程度等)
现将现有评分方法的不足之处总结如下:
(1)人为拍板制定规则使得评分主观性较强,例如一致性指标规则对问题数据量的个数和比率的要求,说服力十分有限。
(2)适应性较差,对评分结果共识不足。例如有上下游系统的情况,由于上下游不参与评分工作,时常出现难以说服上游系统或者下游系统的情况。
(3)评分方式单一,同一指标对所有系统按照相同规则与参数打分,缺乏个性化与定制化,十分粗略。
(4)评分工作量大,对收集数据的人工干预较多,客观性和合理性有待增强。
基于目前方法的不足,为了全面提高评分的全面性、准确性、客观性,增加对上下游系统交流的可信度,降低评分的难度,我们经过深入分析思考发明出一种基于聚类分析技术的全新方法,来评估接口的数据质量情况。
在背景技术部分中公开的以上信息只是用来加强对本文所描述技术的背景技术的理解,因此,背景技术中可能包含某些信息,这些信息对于本领域技术人员来说并未形成在本国已知的现有技术。
发明内容
本申请的主要目的在于提供一种接口数据质量的确定方法、确定装置、处理器、计算机可读存储介质和接口数据质量的确定系统,以解决现有技术中接口数据质量评分人为干预程度大的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国邮政储蓄银行股份有限公司,未经中国邮政储蓄银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210361932.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置