论文阅读《2022ICLR:Are Message Passing Neural Networks Really Helpful for Knowledge Graph Completion? 》

2023-07-21 14:03:04

论文链接

工作简介

最近有关知识图谱补全的工作都集中在使用图神经网络来学习实体、关系的嵌入。

基于 GNN 的模型带来的改进归因于增强的信息聚合过程。因此目前关于为 KGs 开发更好的 GNN 的研究仍然主要集中在推进信息聚合过程。

作者发现:基于 GNN 的模型中的信息聚合过程并不是所报告的KGC性能改进的最关键原因

具体来说,作者用简单的多层感知器(MLPs)替换了几个最先进的以 KGC 为重点的GNN模型中的信息聚合过程,并在各种数据集和实现中实现了与其相应的基于 GNN 的模型相当的性能。

结果表明,评分损失函数确实有更强的影响,而信息聚合过程几乎没有贡献

与基于GNN的模型相比,基于MLP的方法在训练和推理过程中具有更高效的优势,因为它们不涉及昂贵的聚合操作。

 相关工作 – KGC中的聚合过程与评分函数

本文研究了三种具有代表性的基于 GNN KGC 模型,即 CompGCN[1]RGCN[2]KBGAT[3]

与传统 GNN 模型一样,这些模型堆叠多层以迭代地聚合整个 KG 中的信息。每个中间层将前一层的输出作为输入,最后一层的最终输出作为学习到的嵌入。除了实体嵌入,一些基于 GNN 的模型也学习关系嵌入。

RGCN 用特定关系的转换矩阵聚合邻域信息。

CompGCN 定义了基于方向的变换矩阵,并引入关系嵌入来聚合邻域信息。引入组合算子来组合嵌入以利用实体-关系信息。

KBGAT 通过同时考虑实体嵌入和关系嵌入,提出了基于注意力的聚合过程。

GNN聚合层获得最终的嵌入后,相应的实体关系嵌入被用作评分函数的输入。可以采用各种评分函数。

两种广泛使用的评分函数是 DistMult[4] ConvE[5]

𝑓DistMultf_"DistMult" 中的Rr是关系R的对角阵。

ConvE将头嵌入与关系嵌入馈送到卷积层中,然后他们被重塑回一个向量,该向量用尾部嵌入来生成一个分数。

相关工作 – KGC中的损失函数

为了训练GNN模型,KGC任务通常被认为是一个二分类任务。损失函数使用二进制交叉熵(Binary cross-entropy, BCE)

RGCNCompGCNKBGAT之间在三个主要组件方面的主要差异如下:

1.聚合。它们的信息聚合过程是不同的。

2.得分函数。他们采用不同的评分功能。RGCN采用DistMult评分函数,而CompGCNKBGAT采用ConvE取得了最好的性能。

3.损失函数CompGCN利用KG中的所有实体作为负样本进行训练,而RGCN采用负采样策略,仅选择一部分实体作为真负样本进行训练。对于KBGAT,我们也利用所有实体来构造负样本,类似于CompGCN

实验-聚合真的对KGC有帮助吗

实验一:保持其他组件不动,用一个简单的MLP替换它们的聚合组件(?),该MLP与相应的基于GCN的模型具有相同的层数和隐藏维度。

 

 实验-评分函数的影响

实验二:在原始设置中,CompGCNKBGAT使用ConvE作为评分函数,而RGCN采用DistMult。在表1中,我们进一步展示了CompGCNKBGAT使用DistMultRGCN使用ConvE的结果。(不更改其他设置)

评分函数的选择对模型性能有很强的影响。此外,这种影响取决于这些方法应用到的特定数据集。

评分函数并不是影响模型性能的唯一因素。

实验-损失函数的影响

实验三:在原始设置中,CompGCN, RGCNKBGAT采用了BCE损失。损失函数的主要区别在于,CompGCNKBGAT利用了所有负样本,而RGCN采用了抽样策略,随机选择10个负样本进行训练。为了方便起见,我们使用w/o采样和with采样来表示这两种设置,并研究这两种设置如何影响模型性能。

 不可否认,仅使用10个负样本被证明是不够的。

实验-损失函数的影响

实验四:研究负样本数量如何影响模型性能。

将负样本的数量从10增加到一个更大的数字,对所有方法都是有帮助的。

为了获得强大的性能,没有必要利用尽可能多的负样本。

实验- MLP-ensemble模型

实验五:研究了具有不同评分和损失函数组合的基于mlp的模型的性能。具体来说,采用DistMultConvE作为评分函数。对于每个评分函数,尝试了损失函数的with采样和w/o采样设置。

结果:

1.聚合组件对于KGC来说可能是不 必要的。基于mlp的模型可以达到与GNN模型相当甚至更强的性能。

2.评分和损失函数在基于mlp的方法的KGC性能中发挥着至关重要的作用。同时,它们的影响因数据而异。

3.表中的MLP-best表示表4中基于mlp的单个方法的最佳性能。从表中,可以清楚地观察到,MLP-best可以取得与基于GNN的方法相当甚至略好的性能。此外MLP-ensemble可以获得比基于MLP的最佳个体方法和基于GNN的模型更好的性能。这表明,这些评分和损失函数是潜在互补的,因此,即使是简单的集成方法也可以产生更好的性能。

引用:

[1] Vashishth S, Sanyal S, Nitin V, et al. Composition-based multi-relational graph convolutional networks[J]. arXiv preprint arXiv:1911.03082, 2019.

[2] Schlichtkrull M, Kipf T N, Bloem P, et al. Modeling relational data with graph convolutional networks[C]//The Semantic Web: 15th International Conference, ESWC 2018, Heraklion, Crete, Greece, June 3–7, 2018, Proceedings 15. Springer International Publishing, 2018: 593-607.

[3] Nathani D, Chauhan J, Sharma C, et al. Learning attention-based embeddings for relation prediction in knowledge graphs[J]. arXiv preprint arXiv:1906.01195, 2019.

[4]Yang B, Yih W, He X, et al. Embedding entities and relations for learning and inference in knowledge bases[J]. arXiv preprint arXiv:1412.6575, 2014.

[5] Dettmers T, Minervini P, Stenetorp P, et al.Convolutional 2d knowledge graph embeddings[C]//Pro -ceedings of the AAAI conference on artificial intelligence. 2018, 32(1).

更多推荐

浅析-ES6

4、ES6语法指南后端项目搭建完毕,接下来就是前端页面了。不过在这之前需要一些准备工作。我们需要学习ES6的语法标准。什么是ES6?就是ECMAScript第6版标准。4.1.什么是ECMAScript?来看下前端的发展历程:web1.0时代:最初的网页以HTML为主,是纯静态的网页。网页是只读的,信息流只能从服务的到

2023年8月知识复习

物联网总括物联网即通过网络将客观事物进行智能化互联的网络系统。互联网主要是人与人、人与计算机之间的通信,而物联网主要是物联网设备之间的通信。注意:数据上传到云端不是物联网的必要条件。物联网可以仅在本地网络和局域网中进行通信和数据处理。比如在工业控制系统中,设备之间需要实时通信和数据处理,但出于隐私、安全性或数据管控的考

C++核心编程之类和对象---C++面向对象的三大特性--封装

目录类和对象类和对象的概念C++面向对象的三大特性一、封装封装案例1:设计一个学生类,可以给姓名和学号赋值,可以显示学生的姓名和学号。二、访问权限访问权限有三种struct和class的区别三、成员属性私有化成员属性私有化的优点:四、封装案例案例1:设计立方体类案例2:点和圆的关系类和对象面向对象编程(OOP)是现代编

【C语言】进阶——字符串和内存函数

目录一:非限制字符串函数1.strlen👊模拟实现方法1:计算器法方法2.指针-指针方法3.函数调用2.strcpy👊模拟实现3.strcat👊模拟实现4.strcmp👊模拟实现二:可限制字符串函数1.strncpy2.strncat3.strncmp4.strstr👊模拟实现5.strtok6.strerr

【1++的C++进阶】之C++11(二)

👍作者主页:进击的1++🤩专栏链接:【1++的C++进阶】文章目录一,类的新变化二,可变参数模板三,lambda表达式一,类的新变化在C++03之前,我们的默认成员函数有6个,我们在类与对象这篇中有过详细的讲解。C++11中又增加了两个默认成员函数—移动构造与移动赋值重载,其底层原理以及优势我们在上节已经有过描述。

在本地搭建WAMP服务器并通过端口实现局域网访问(无需公网IP)

文章目录前言1.Wamp服务器搭建1.1Wamp下载和安装1.2Wamp网页测试2.Cpolar内网穿透的安装和注册2.1本地网页发布2.2Cpolar云端设置2.3Cpolar本地设置3.公网访问测试4.结语前言软件技术的发展日新月异,各种能方便我们生活、工作和娱乐的新软件层出不穷,但也有一些经过时间和用户考验的老牌

服务器基准测试实践:SysBench的搭建与基本使用

🏆作者简介,黑夜开发者,CSDN领军人物,全栈领域优质创作者✌,CSDN博客专家,阿里云社区专家博主,2023年6月CSDN上海赛道top4。🏆数年电商行业从业经验,AWS/阿里云资深使用用户,历任核心研发工程师,项目技术负责人。🎉欢迎👍点赞✍评论⭐收藏文章目录🚀一、SysBench是什么?🚀二、SysBe

VSCode 安装使用教程 环境安装配置 保姆级教程

一个好用的IDE不仅能提升我们的开发效率,还能让我们保持愉悦的心情,这样才是非常Nice的状态^_^那么,什么是IDE呢?whatIDE(IntegratedDevelopmentEnvironment,集成开发环境)是含代码编辑器、关键词高亮、智能感应、智能纠错、格式美化、版本管理等功能于一身的"高级代码编辑器"每个

MySQL(4)索引实践(2)

一、分页优化limit100010,其实不是只查询出10条记录,mysql底层会查询出1100条,然后舍去前1000条所以,随着页的增多,查询效率会降低1、可以使用取范围的方式比如id>1000方式优化2、使用关联查询优化,子表使用覆盖索引,不用查出来所有数据,主表关联子表查询出数据二、关联表执行过程(1)两种算法1、

Keepalived

这里写目录标题Keepalived一、Keepalived相关知识点概述1.单服务的风险(单点故障问题)2.一个合格的集群应该具备的特性3.VRRP虚拟路由冗余协议4.健康检查5.脑裂二.keepalive1.Keepalived介绍2.Keepalived体系主要模块及其作用3.keepalived原理4.keepa

大数据-离线项目

第一章需求分析需求分析与设计项目需求背景"某APP上线后经营得当使用户日活量增多出现以下问题""营销分析断层:"市场营销成本居高不下,投放拉新的效果追踪出现断层,无法追踪各渠道实际转化率,难以准确分析ROI。"产品迭代无法量化:"缺少实时的用户行为分析能力,使产品功能不知道怎么改改好了也不知道效果怎么样"用户运营不精准

热文推荐