[发明专利]一种基于混合分类技术的大众贡献审阅自动标注方法有效
申请号: | 201710484791.3 | 申请日: | 2017-06-23 |
公开(公告)号: | CN107291902B | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 余跃;李志星;尹刚;王涛;王怀民;范强;李立 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F11/36;G06F8/71;G06F8/30 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 陆薇薇 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于混合分类技术的大众贡献审阅自动标注方法,其涉及软件协同开发领域。该方法包括:首先对GitHub平台数据进行采集,所收集的数据主要包括大众合并请求和其他开发者对这些大众合并请求的审阅评论;然后选取GitHub经典的项目进行人工分析,结合领域相关研究定义完善的类别体系;然后随机采样一部分pull‑request和其对应的所有审阅评论,利用在线标记平台通过多人协同的方式进行人工标注;最后利用人工标记的数据集训练基于混合分类技术的标注模型,再利用训练所得模型对未标记审阅评论进行自动化标注。本发明能够提升人工代码审查的自动化水平,降低人工成本,提高大众贡献汇聚效率。 | ||
搜索关键词: | 一种 基于 混合 分类 技术 大众 贡献 审阅 自动 标注 方法 | ||
【主权项】:
一种基于混合分类技术的大众贡献审阅自动标注方法,其特征在于,所述大众贡献审阅自动标注方法包括如下步骤:S1.对GitHub平台数据进行采集,所采集的数据包括大众合并请求(Pull‑request)和其他开发者对所述大众合并请求(Pull‑request)的审阅评论;S2.选取GitHub经典的项目进行人工分析,结合领域相关研究级定义两级的审阅评论分类体系;S3.随机采样一部分大众合并请求(Pull‑request)和其对应的所有审阅评论,利用在线标记平台通过多人协同的方式进行人工标注,形成数据集;S4.利用人工标记的数据集训练基于混合分类技术的标注模型,然后利用训练所得标注模型对未标记评审评论进行自动化标注。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710484791.3/,转载请声明来源钻瓜专利网。