关系抽取工具浅析"/>
关系抽取工具浅析
1.Jiagu
思知(ownthink)开发的,对于百度百科文本,还能提取到部分三元组,抽取到的三元组有重复,有些比较奇怪,有些百科文本也提取不到任何三元组。其他文本就根本不行。
Jiagu可以同时抽取出实体和实体之间的关系。
2.DeepKE
关系抽取用到的模型有很多:BiLSTM、Capsule、GCN(先用工具提取出句子的语法树,构建出词语之间的邻接矩阵,然后用GCN。依赖语法树的准确性)、LM、CNN、Transformer
可以用自己的训练数据重新训练模型,上述几个模型可视为baseline,代码写的很好,调试也比较方便。
DeepKE是只包括关系预测。关系所涉及的实体需要自己输入,也就是需要自己做实体识别。
3.DeepDive
Deepdive是由斯坦福大学InfoLab实验室开发的一个开源知识抽取系统。它通过弱监督学习,从非结构化的文本中抽取结构化的关系数据 ,可以判断两个实体间是否存在指定关系。具有较强的灵活性,可以自己训练模型。有支持中文版的
安装过程需要翻墙。使用金融交易数据作为训练数据,可以完成实体识别和关系抽取两步。
4.Reverb
Reverb是华盛顿大学Turing center研发的开放三元组抽取工具,可以从英文句子中抽取形如(augument1, relation, argument2)的三元组。它不需要提前指定关系,支持全网规模的信息抽取。目前用于华盛顿大学开发的knowitall知识库系统。
5.OLLIE
和Reverb类似,都是华盛顿大学研发的知识库KnowItAll的三元组抽取组件,OLLIE是第二代提取系统。Reverb的抽取建立在文本序列上,而OLLIE则支持基于语法依赖树的关系抽取,对于长线依赖效果更好。
更多推荐
关系抽取工具浅析
发布评论