研究进展 笔记"/>
CCKS 2022 KG中的实体对齐研究进展 笔记
一、什么是实体对齐
在多个来源的知识图谱间寻找相同的实体
二、实体对齐的意义
知识图谱融合的核心步骤,
跨语言实体对齐,丰富小语种KG的信息
跨域实体对齐
三、实体对齐的挑战
1、数据标注
训练模型的种子对齐实体,需要人工标注
- ActiveEA 2021 ACL 提出了一种结构感知的不确定性抽样策略
- RNM AAAI 2021 提出了一个半监督框架,实体对齐和关系对齐可以相互学习,利用关系的语义信息和映射属性来更好地对齐实体
- SEU EMNLP 2021 基于语义信息把EA看成分配问题,置换矩阵表示Gs和Gt之间的实体对应关系 无监督的方法
- PRASE IJCAI 2021 无监督的方法,语义信息结合概率推理,选择置信度高的实体映射作为对齐种子S,随后基于这些种子训练语义嵌入模块
- SelfKG WWW 2022 自监督学习,提出相对相似度度量,尝试将未对齐的实体对推远
2、KG中哪些是有效信息对于EA
预训练模型的实体名表示
- 结构信息 EASY SIGIR 2021提出了NEAP方案,根据实体名称获得初始EA,通过图结构信息来增强EA结果
- RePS WWW 2022 提出了一种基于多因素表示学习的EA方法,Relation、Position and Structure aware EA
- EVA AAAI 2021 利用实体的视觉相似性来创建初始种子字典,无监督
3、计算效率优化
处理20万个节点的KG需要几个小时甚至几天
- Dual-AMN WWW 2021 过于复杂的图编码器与效率低下的负采样策略是主要原因,提出了Dual Attention Matching Network
- PSR CIKM 2021 低效的图编码器、负采样困境、半监督学习中的灾难性遗忘,提出了高性能、高扩展性、高鲁棒性的模型PSR
- On entity alignment at scale VLDB 2021 设计了面向种子的图划分策略
- LargeEA VLDB 2022 mini-batch生成策略
- ClusterEA KDD 2022 新的采样策略
4、相似度计算
- 传统的相似度计算方法:余弦距离、曼哈顿距离、CSLS(Cross-domain similarity Local Scaling)
- RNM AAAI 2021 利用关系的语义信息和映射属性,
- SparseFusion ClusterEA KDD 2022 局部和全局相似度归一化,融合多个相似度矩阵的方法来构建相似度矩阵。
- UPLR WWW 2022 图交互散度
5、动态KG实体对齐
- DINGAL AAAI 2021 动态知识图谱对齐,在动态变化的图拓扑结构中有效更新实体嵌入表示,将GCN的参数矩阵看作一个特征变换运算,把变换过程与聚合过程解耦
- TEA-GNN EMNLP 2021 将关系和时间合并到GNN中
- TREA WWW 2022使用时间关系注意机制
- 集成方法 Cycle-teaching AAAI 2022 多个对齐器,循环教学
- KE-GCN WWW 2021 基于知识嵌入的GCN
四、实体对齐的展望
更多推荐
CCKS 2022 KG中的实体对齐研究进展 笔记
发布评论