admin管理员组

文章数量:1580424

论文出处:ACL 2019
1. 摘要

论文提出了一种基于知识图谱能主导对话的对话系统,并开源了对应的数据集DuConv。该数据集涉及电影、导演和演员相关题材,包含3w个多轮对话,约27w个句子。每个对话包含一个目标三元组[START, TOPIC_A, TOPIC_B],表示系统的目标是将对话主题从A引导到B;另外包括一系列跟TOPIC_A或者TOPIC_B有关的知识三元组,形式为(主体,谓词,客体),表示主客体之间的关系,比如(张艺谋,导演,红高粱);然后包括多轮对话。数据示例如下(文末附json格式的示例):

2. 模型

论文提出了基于检索和生成的两种模型。

2.1 检索模型

检索模型的整体思路是对每个对话先筛选出n个候选句子,然后使用模型对这n个候选句子打分,选出得分最高最高的句子,作为最终的目标句子。因此分两个主要步骤,一个是筛选得到候选句子

本文标签: machineHumanProactiveGoalsExplicit