[发明专利]具有合并处理方法的大数据支撑平台有效
申请号: | 201710851820.5 | 申请日: | 2017-09-19 |
公开(公告)号: | CN107590254B | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 高英;成昱霖 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/27 | 分类号: | G06F16/27 |
代理公司: | 重庆中之信知识产权代理事务所(普通合伙) 50213 | 代理人: | 蒲艳紫 |
地址: | 510630*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种具有合并处理方法的大数据支撑平台,包括:服务器以及用户终端,服务器内存储有计算包,计算包包括数据源读写算子、数据预处理算子、特征工程算子、模型算子以及合并处理算子,合并处理算子包括合并处理开始分算子以及合并处理结束分算子,当用户在用户终端上建立任务流程中需要使用相同流程段对两不同数据集进行处理时,合并处理开始分算子用于建立在所述流程段之前,且合并处理结束分算子用于建立在所述流程段之后。该具有合并处理方法的大数据支撑平台解决现有技术中因需建立两个相同的流程段分别对两个不同数据集进行处理而导致同一个流程段被调用两次的问题。 | ||
搜索关键词: | 具有 合并 处理 方法 数据 支撑 平台 | ||
【主权项】:
一种具有合并处理方法的大数据支撑平台,其特征在于,包括:分布式存储计算集群、服务器以及用户终端,分布式存储计算集群内存储有计算包,计算包包括数据源读写算子、数据预处理算子、特征工程算子、模型算子以及合并处理算子,合并处理算子包括合并处理开始分算子以及合并处理结束分算子,当用户在用户终端上建立任务流程中需要使用相同流程段对两不同数据集进行处理时,合并处理开始分算子用于建立在所述流程段之前,且合并处理结束分算子用于建立在所述流程段之后,其中,流程段中包含的算子为数据源读写算子、数据预处理算子、特征工程算子以及模型算子的一种或多种;服务器解析用户在用户终端上建立的任务流程时包括以下步骤:S11、服务器从用户终端上获取任务流程并生成最终可执行队列;S12、服务器根据最终可执行队列依次调用分布式存储计算集群中的算子对待分析数据进行处理,以得到最终分析结果,其中,当遇到合并处理算子时处理步骤如下:S121、服务器调用合并处理开始分算子,将两不同数据集合并为待处理数据串;S122、服务器依次调用流程段中各个算子处理待处理数据串并得到处理后数据串;S123、服务器调用合并处理结束分算子,将处理后数据串分隔为与两不同数据集对应的两处理结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710851820.5/,转载请声明来源钻瓜专利网。