[发明专利]一种跨域自适应的图卷积平衡迁移学习方法与系统在审
申请号: | 202110363771.7 | 申请日: | 2021-04-02 |
公开(公告)号: | CN113128667A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 陈益强;高晨龙;蒋鑫龙;陈前 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;张燕华 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 图卷 平衡 迁移 学习方法 系统 | ||
本发明公开一种跨域自适应的图卷积平衡迁移学习方法,包括:将源域数据和目标域数据输入第一图卷积神经网络,分别得到源域数据和目标域数据中节点的局部特征;将源域数据和目标域数据输入第二图卷积神经网络,分别得到源域数据和目标域数据中节点的全局特征;利用注意力机制将源域数据和目标域数据中节点的局部特征和全局特征进行聚合,得到源域数据和目标域数据中节点的统一特征;基于源域数据和目标域数据中节点的统一特征,构建源域分类器和目标域分类器分别对源域数据和目标域数据中节点进行分类,构建领域分类器用于判定节点来自源域数据或者目标域数据。
技术领域
本发明涉及机器学习领域,具体涉及一种跨域自适应的图卷积平衡迁移学习方法与系统。
背景技术
图(Graph)数据包含着十分丰富的关系型信息。从文本、图像这些非结构化数据中进行推理学习,例如句子的依赖树、图像的场景图等,都需要图推理模型。图网络(Graphneural networks)是一种链接主义模型,它靠图中节点之间的信息传递来捕捉图中的依赖关系。近年来,图卷积网络(Graph Convolutional network)在众多领域取得了重大的成功。卷积神经网络(CNN)是GCN起源的首要动机。CNN有能力去抽取多尺度局部空间信息,并将其融合起来构建特征表示。但CNN只能应用于常规的欧几里得数据上(例如二维的图片、一维的文本),这些形式的数据可以被看成是图的实例化。
在各种图网络应用中,节点分类是一项重要且具有挑战性的任务,如社交网络、蛋白质相互作用网络和引文网络等任务中。在过去的十年中,人们为了开发可靠有效的节点分类方法进行了大量的研究工作。然而,现有的方法大多集中在单个图的节点图表示上,在很大程度上忽视了分类模型向全新图的推广。因此,当收集到新的图时,即使它与现有的图非常相似,我们也必须重新标记图中的节点,并为节点分类任务重建分类器模型。现有的图形数据学习框架的无效对可迁移模型提出了更高的要求,目标是使知识从源图适应到目标图。
领域自适应(Domain adaptive)是指通过最小化域间差异,支持从有足够标签信息的源域到有大量无标签数据的目标域的迁移学习,已经引起了计算机视觉和自然语言处理等领域的广泛关注。然而,将领域自适应应用于网络分析,如跨网络节点分类等,还没有得到充分的研究。无监督图域自适应的目的是利用源网络中丰富的标记信息,为目标网络建立准确的节点分类器。目前,领域自适应的研究大多集中在CV(计算机视觉)和NLP(自然语言处理)领域,不能直接应用于节点分类问题。原因有两方面:首先,这些方法通常是为CV和NLP任务设计的,这些任务中的样本(如图像和序列)是独立的和相同分布的,因此对模型旋转不变性的要求很少。然而,由于图同构现象,网络结构化数据中的节点与表示其关系的边相连,需要具有旋转不变性的模型。因此,现有的方法不能对网络结构信息进行建模,而网络结构信息是节点分类的核心。其次,大多数现有的领域适应模型以监督的方式学习判别表示,其中损失函数的值只与每个单个样本在其特征空间中的绝对位置相关。另外,用于节点分类的网络嵌入通常是通过保持相对位置,以一种无监督的方式学习多用途表示。因此,需要构建跨域自适应的平衡迁移方法,解决无监督节点分类问题。
发明内容
针对应用场景下存在大量多模态无标签感知数据,数据间存在复杂关联和非均衡性的问题,本发明的主要目的在于提出一种跨域自适应的图卷积平衡迁移学习方法与系统,构建基于对偶图卷积的多模数据量化关联方法,表征目标域与源域之间存在的显性或者隐性关联,进行源域和目标域之间数据的关联映射和样本平衡重构,实现基于源域和目标域之间量化关联约束的精准迁移学习。
为了实现上述目的,本发明提出了一种跨域自适应的图卷积平衡迁移学习方法,其包括:
将源域数据和目标域数据输入第一图卷积神经网络,分别得到所述源域数据和所述目标域数据中节点的局部特征;
将所述源域数据和所述目标域数据输入第二图卷积神经网络,分别得到所述源域数据和所述目标域数据中节点的全局特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110363771.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种热流局部集中下矩形窄缝通道试验段及试验方法
- 下一篇:显示面板