[NLG]Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study?

编程知识更新时间:2023-05-02 21:01:47

摘要：

为了发现对话历史是否真的被有效的利用了，本文介绍了10种干扰来评测对话历史是否真正被利用。发现transformer-seq2seq 和rnn seq2seq并没有很好地利用这些信息

首先有一个前提：如果模型对于对话历史的改变不敏感的话，那么他基本上没有利用多少对话历史。

在之前的工作中已经发现：

本文要测试transformer，rnn，以及是否加attention对于对话历史的利用

其中x1,x2,...xn是对话历史，如果是A，B两个人对话的话，相当于A的所有话，yi表示B之前说的话，现在要利用A说的所有话和B在第i句之前的所有话来预测第i句的概率。通过这个loss函数来优化。

扰动类型分别对于句子和词语有：1.随机打乱句子顺序 2. 将对话翻转顺序 3.随机删掉某些句子 4.保留最近的K个句子

用一系列实验证明了，当前的模型对于dialogue history的利用并不多。可以利用这些实验作为对NLG生成的一个eval。

更多推荐

[NLG]Do Neural Dialog Systems Use the Conversation History Effectively? An Empir

本文发布于:2023-04-28 16:23:00，感谢您对本站的认可！

评论列表（有 0 条评论）