论文阅读《ESSWC2018:Modeling Relational Data with Graph Convolutional Networks》

2023-07-26 09:39:35

论文链接

本文就是大名鼎鼎的R-GCN,由于是比较早的工作了,在这篇博客中我们只讨论它的链接预测部分和模型结构部分。

工作简介

本文引入了关系图卷积网络(R-GCNs),并将其应用于两个标准的知识库完成任务: 链接预测实体分类

通过使用GNN编码器模型来丰富用于链接预测的因子分解模型DistMult,可以显著改善链接预测的结果。R-GCN可以视为是一个自动编码器,产生实体潜在特征的表示。

R-GCN是首次将GCN用于关系数据建模。

工作简介-关系图卷积网络

模型主要是作为在局部图邻域上操作的GCNs扩展到大规模关系数据。可以理解为简单可微消息传递框架的特殊情况,结构简介如下:

 

hi(l)是结点vi在第l层的隐藏状态。

d(l)是该层的表征维度

形式为gm(··)的传入被累计并通过激活函数σ(·)传递。

Mi表示结点vi的传入消息集合,通常被选择为与传入边集合相同。

gm(··)通常被选择为(特定于消息的)类神经网络函数或简单的线性变换。如gm(hihj)=Whj

这种类型的转换已被证明在从局部、结构化邻域积累和编码特征方面非常有效。

内容介绍-关系图卷积网络

基于上述架构,定义RGCN的传播模型,用于计算关系型多图(有向)中由vi表示的实体的前向传递更新:

 𝑁i𝑟表示节点i关系r𝑅邻居合集ci,𝑟一个特定于问题的归一化常数,既可以学习也可以提前选择。

上式通过归一化和累计相邻节点变换后的特征向量。与常规的GCN不同的地方在于RGCN引入了特定于关系的转换,即根据边的类型和方向进行转换。

为了确保l+1层节点的表示可以被l层对应的表示所告知,我们为每个节点添加一个特殊关系类型的单一自连接。

神经网络层的更新包括对图中每个节点用上式进行并行评估,在实践中,上式可以通过稀疏矩阵乘法有效地实现,以避免对领域进行显式求和。可以堆叠多个层,以允许跨几个关系步骤的依赖关系。

 内容介绍-正则化

将上述传播过程应用于高度多关系数据的一个核心问题就是参数的数量随着图中关系的数量快速增长。在实践中,这很容易导致对罕见关系和对非常大的规模的模型的过度拟合。

为了解决这个问题,引入两种不同的方法来正则化R-GCN的权重,基分解块对角线分解

通过基分解, 每个𝑊𝑟(𝑙)的定义如下:

(3)

 

 只取决于rW是基变换的线性组合。

W也可以通过对一组低维矩阵的直接求和来定义。

(4)

W_r^((l))是块对角矩阵,

基函数分解(3)可以看作是不同关系类型之间有效的权重共享的一种形式,而块分解(4)可以看作是对每种关系类型的权重矩阵的稀疏性约束。块分解结构编码了一种直觉, 即潜在特征可以被分组到变量集中,这些变量集在组内比组间耦合更紧密。两种分解都减少了高度多关系数据(如现实的知识库)所需学习的参数数量。同时,我们期望基参数化可以缓解稀有关系上的过拟合,因为参数更新在稀有关系和更频繁的关系之间共享。

内容介绍-评分函数和损失函数

整个R-GCN模型采用以下形式:

(2)中定义的L层堆叠起来前一层的输出是下一层的输入。如果没有其他特征存在,第一层的输入可以被选择为图中每个节点的唯一的one-hot向量。对于块表示,我们通过单个线性变换将这个one-hot向量映射到一个稠密表示。

DistMult作为评分函数:

 DistMult中,每个关系r都与一个对角矩阵Rr∈R^dxd相关联

 用负采样训练模型。对于每个观察到的例子,对ω负样本进行采样。通过随机破坏每个正例的主体或客体来采样。优化交叉熵损失,以推动模型对正三元组的评分高于负三元组的评分。

这篇工作的关键特征是对编码器的依赖:

 

 实验结果

 

 

更多推荐

华为云云耀云服务器L实例评测 | 华为云部署Docker容器

文章目录一、什么是Docker二、Docker的好处☁️模块化⛅层和镜像版本控制❄️回滚⚡快速部署三、华为云云耀云服务器L实例安装Docker四、Docker安装镜像测试五、Docker常用命令⛵小结一、什么是DockerDocker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然

华为云云耀云服务器L实例评测|使用宝塔10分钟部署一个围猫猫小游戏

目录前言一、选择华为云云耀云服务器L实例的原因二、华为云云耀云服务器的优势三、快速部署一个小游戏(1)终端部署1、使用`Termius`工具连接终端2、安装Nginx3、上传打包文件(2)宝塔可视化面板部署1、进入宝塔2、宝塔菜单3、上传代码4、下载Nginx应用5、配置Nginx(1)可视化面板配置(2)直接修改`n

Pytest自动化测试 - 必知必会的一些插件

【软件测试行业现状】2023年了你还敢学软件测试?未来已寄..测试人该何去何从?【自动化测试、测试开发、性能测试】Pytest拥有丰富的插件架构,超过800个以上的外部插件和活跃的社区,在PyPI项目中以“pytest-*”为标识。本篇将列举github标星超过两百的一些插件进行实战演示。插件库地址:http://pl

浅谈 AI 大模型的崛起与未来展望:马斯克的 xAI 与中国产业发展

文章目录💬话题📋前言🎯AI大模型的崛起🎯中国AI产业的进展与挑战🎯AI大模型的未来展望🧩补充📝最后💬话题北京时间7月13日凌晨,马斯克在Twiiter上宣布:“xAI正式成立,去了解现实。”马斯克表示,推出xAI的原因是想要“了解宇宙的真实本质”。GhatGPT横空出世已有半年,国内外“百模大战”愈演愈

内网IP端口提供外网连接访问?快解析动态域名与内网映射P2P穿透方案

我们在本地搭建服务器及发布互联网时,可以通过动态域名的方式联网。DDNS原理是用固定的域名代替变化IP,实现局域网发布公网,是适合本地动态IP环境的使用。但当本地没有公网IP时,如果解析绑定到内网IP,将内网IP端口提供外网连接访问?这时我们就需要用到内网映射的方式了。动态域名与内网映射是二种不同的方法,分别针对动态公

Apache Hive安装部署详细图文教程

目录一、ApacheHive元数据1.1HiveMetadata1.2HiveMetastore二、Metastore三种配置方式​2.1内嵌模式​2.2本地模式​2.3远程模式​三、Hive部署实战3.1安装前准备3.2Hadoop与Hive整合3.3远程模式安装3.3.1安装MySQL3.3.2Hive安装3.4启

汉威科技亮相2023上海传感器展,智能传感新品引关注

作为全球三大传感器展之一的中国(上海)国际传感器技术与应用展览会,被誉为全球传感器行业发展的风向标,每届展会都会展出数以万计的行业尖端传感新技术和新产品。今年,第8届中国(上海)国际传感器技术与应用展览会于9月13至15日在上海跨国采购会展中心起航。此次展会上,车载传感、激光和柔性传感等智能传感领域的新品受到了关注。近

100天精通Python(可视化篇)——第99天:Pyecharts绘制多种炫酷K线图参数说明+代码实战

文章目录专栏导读一、K线图介绍1.说明2.应用场景二、配置说明三、K线图实战1.普通k线图2.添加辅助线3.k线图鼠标缩放4.添加数据缩放滑块5.K线周期图表书籍推荐专栏导读🔥🔥本文已收录于《100天精通Python从入门到就业》:本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学,从0到100的不断进阶

【Python 数据科学】Dask.array:并行计算的利器

文章目录1.什么是Dask.array?1.1Dask简介1.2Dask.array概述1.3Dask.array与Numpy的对比2.安装与基本用法2.1安装Dask库2.2创建Dask数组2.3数组计算与操作3.Dask.array的分块策略3.1数组分块的优势3.2调整分块大小3.3数据倾斜与rebalance4

OpenMMLab MMYOLO目标检测应用示例与常见问题(三)

基于MMYOLO的电离图实时目标检测基准数据集数字电离图是获取实时电离层信息的最重要方式。电离层结构检测对于准确提取电离层关键参数具有重要的研究意义。本研究利用中国科学院在海南、武汉和怀来获得的4311张不同季节的电离图建立数据集。使用labelme手动注释包括LayerE、Es-l、Es-c、F1、F2和Spread

【SpringBoot系列】Spring cloud Gateway 动态路由到底有多简单

🤵‍♂️个人主页:@香菜的个人主页,加ischongxin,备注csdn✍🏻作者简介:csdn认证博客专家,游戏开发领域优质创作者,华为云享专家,2021年度华为云年度十佳博主🐋希望大家多多支持,我们一起进步!😄如果文章对你有帮助的话,欢迎评论💬点赞👍🏻收藏📂加关注+系列文章:SpringBoot学习大

热文推荐