关键词:
知识图谱
表示学习
数据类型
曲率空间
摘要:
知识图谱表示学习旨在将实体和关系编码到连续、低维的向量空间中,然而,现有的方法仅集中于在欧氏空间中学习结构三元组的表示,不能很好地利用丰富的语义信息且计算效率低下。本文将结合曲率空间和语义信息两个方面,提出四种知识图谱语义表示学习模型。本文引入属性值的数据类型,并将其精化为五种模态,包括整数型、浮点型、布尔型、时间型以及文本型。通过设计通用编码器及专用编码器,本文提出了基于欧氏及球形空间的知识图谱语义表示学习模型DT-EGCN和DT-SGCN,在实现将数据类型融入知识图谱表示学习之中的同时,探索零曲率空间与正曲率空间的表示学习能力。本文引入双曲几何,定义双曲空间中的基本运算符,包括空间映射函数,莫比乌斯加法、矩阵-向量乘法、哈达玛积,以及双曲激活函数。进一步地,本文定义了一个基于欧氏、球形和双曲空间的统一空间,该统一空间具有连续曲率,能够结合三种不同空间的优点。通过将上述思想引入DT-EGCN和DT-SGCN模型,本文提出了基于双曲及统一空间的知识图谱语义表示学习模型DT-HGCN和DT-UGCN,探索负曲率空间与连续曲率空间的表示学习能力。本文使用节点分类和链接预测任务,在3个合成数据集和1个真实数据集上对DT-EGCN、DT-SGCN、DT-HGCN以及DT-UGCN模型进行实验评估。实验结果表明,相比于欧氏空间中的最优基线模型,DT-EGCN和DT-SGCN模型在各项评估指标上平均提升了17.42%和14.34%。相比于双曲空间中的最优基线模型,DT-EGCN和DT-SGCN模型在各项评估指标上平均提升了10.58%和13.57%,验证了利用属性值的数据类型信息和统一空间的优势。