关系抽取的问题"/>
关于关系抽取的问题
介绍一下TPLinker。
TPLinker定义三种标注EH2ET,SH2OH,ST2OT。假设序列长为N,实体类数为T个,关系类别为R个。根据标注标签生成2R+1个结果矩阵。
EH-to-ET,紫色标签,同一实体的头尾关系,是1个N×N矩阵。
SH-to-OH,红色标签,subject和object的头部token间的关系,是R个N×N矩阵。
ST-to-OT,蓝色标签,subject和object的尾部token间的关系,是R个N×N矩阵。
因为实体尾部不可能出现在头部之前,所以可以舍弃掉下三角区域,但是红标和蓝标可能出现在下三角区域,因此,可以把下三角区域的值映射到上三角,并标记为2。
TPLinker其实就是在上面这种multi-head的思想基础上,最后输出的是一个[batch, seq_len, seq_len, num_label], num_label=2R+1。
介绍一下GPLinker。
TPLinker是没有区分实体类型的,故序列长为N,实体类数为T个,关系类别为R个,则会根据标注标签生成2R+1个结果矩阵,而GPLinker是有区分实体类型的,故会根据标注标签生成2R+T个结果矩阵。其他的部分则是TPLinker差不多。
更多推荐
关于关系抽取的问题
发布评论