A Diversity-Promoting Objective Function for Neural Conversation|电子爱好者

admin管理员组
文章数量:1565290

本篇分享的文章是前一篇分享A Persona-Based Neural Conversation Model的pre-paper，题目是A Diversity-Promoting Objective Function for Neural Conversation Models，作者是Jiwei Li，最早于2015年10月11日发在arxiv上。

本文针对的问题是seq2seq方案在解决bot问题上容易生成一些“呵呵”的reply，比如“I don’t know”之类的非常safe，grammatical的reply，但是营养太少，没有太多实际的意义。造成这种情况的原因是目标函数不合适，在最近流行的自然语言生成任务中一般都采用MLE作为目标函数，这个目标函数可以保证生成出最自然的语言，但diversity太差，当然如果在decoding部分生成大量的N-best list的话，也是有很多不错的reply但都排名很靠后。

本文就是针对这样的一个问题，提出了用Maximum Mutual Information（MMI）作为目标函数来提高reply的diversity和实用性。MMI这个目标函数在Jiwei Li的多篇文章中都出现过，他很喜欢用这个来代替MLE作为目标函数来解决问题。互信息的方程如下：

经过简单的推导，可得出下式作为目标函数：

而，一般的seq2seq采用MLE，如下式：

本文方法比传统seq2seq多了后面的一项。

p(T)其实是一个语言模型，为了在目标中控制reply的多样性，添加一个惩罚系数，如下式：

这个式子记作(4)，经过简单的推导得到下式：

记作(5)

作者根据式子(4)和(5)提出了两种MMI，分别是MMI-antiLM和MMI-bidi。

首先是antiLM，单看-log p(T)这一项，其实就是一个语言模型，anti表示反着的，因为有个负号。这一项不仅仅可以影响到你生成reply的diversity，同时也可以影响到你生成的reply是否是grammatical的，其实是一把双刃剑，需要做好控制，一般来说lambda小于1之后，后一项的影响相对较小了。

本文用一个带权重的语言模型U(T)来替换当前的p(T)，如下式：

这里g(k)是权重，k是index，g(k)的特点是随着k的增加单调递减。这样做有两个目的：

1、decoding时对先生成的词的惩罚比后生成的词的惩罚对diversity的影响更大。

2、随着decoding部分的输入对后续生成影响的减弱，语言模型U(T)将会占主导地位，reply后面的部分也会非常grammatical。

bidi这个目标函数的思路是，先从第一项来生成N-Best List，然后用第二项对其进行排序，将diversity更好的reply放在前面。

在训练过程中，仍旧是采用MLE，但在测试的时候，用本文提到的MMI来做测试。

这个结果是由MMI-antiLM产生的：

这个结果是MMI-bidi产生的：

生成的reply确实seq2seq更加有营养。

本文解决问题的一个思路是很有借鉴意义的，正如abstractive summarization中有一篇paper用MRT来替换传统的MLE作为目标函数，将评价指标考虑进了目标函数中进行优化，起码在benchmark上得到非常好的结果。这其实是一条不错的路，就是将你当前的评价指标融入到你的优化目标中进行优化学习，自然会得到比单纯地用MLE来优化要好的多，也有很多的paper在用这样的思路解决问题。我们不仅仅满足于可以生成一个grammatical的reply，我们更需要的是有意义的、有实际使用价值的bot。另外就是具体到目标函数的建模，如果你希望目标中减小哪些因素对目标的影响，就增加一项惩罚项，这也是做优化时候的一般方案，但在解决具体问题时会非常有效。本文虽然针对的是bot reply的生成问题，其实可以推广到一般的自然语言生成问题上来，只是要涉及到MLE做生成都可以换成本文的方法来提升相应的指标。

来源：paperweekly

原文链接

本文标签： Objective Promoting Diversity Conversation neural

版权声明：本文标题：A Diversity-Promoting Objective Function for Neural Conversation 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1725456620a1024272.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

A Diversity-Promoting Objective Function for Neural Conversation

更多相关文章

ORID焦点呈现法（Focused Conversation Method）

讲座： conversation

A Diversity-Promoting Objective Function for Neural Conversation

ZIgzag conversation

《论文阅读》BERT-ERC: Fine-tuning BERT is Enough for Emotion Recognition in Conversation

uvalive6680 - Join the Conversation动态规划

sql server 2005 T-SQLBEGIN DIALOG CONVERSATION (Transact-SQL)

Mentorship conversation 2

[NLU] DialogueGCN: A Graph Convolutional Neural Network for Emotion Recognition in Conversation

Mms conversation部分学习总结

JTA Entity JPA 事务(Transaction) 会话(Conversation)

【JBOSS seam】用好你的CONVERSATION CONTEXT

chatGPT Unable to load conversation 问题

Seam页面conversation作用域的控制问题

第四次上IM课（IMO46：How to Start a Conversation）

Designing Distributed Systems - A Conversation with Ken Arnold, Part III 阅读笔记

&quot;Contracts and Interoperability A Conversation with Anders Hejlsberg, Part V&quot; 阅读笔记

SESSION-BASED RECOMMENDATIONS WITH RECURRENT NEURAL NETWORKS

综述笔记：A comprehensive survey on Graph Neural Networks

【论文解读 | AAAI2020】NeuralCD：Neural Cognitive Diagnosis for Intelligent Education Systems

发表评论

推荐文章

[Windows] 迅雷 无修改 无限制 无视封锁

用光碟换linux成windows,window_Windows光盘制作U盘安装系统，我们一直使用 CD 和 DVD 光盘来 - phpStudy...

linux中重装mysql

怎样让计算机共享,普通打印机如何设置共享并且共享到其他电脑？

修改百度输入法截图保存的默认文件名

热门文章

cleanmymac x断网激活免费码有必要买吗

HTML5移动开发：手机屏幕分辨率和手机浏览器分辨率

水深火热的国内三大语音输入法对比

迅雷，终于回来了！

确认个人电脑外网ip，并设置阿里云服务器只允许该ip访问

计算机中我的云文档在哪儿里,保存到云文档的文件存在哪里了?是自己的电脑硬盘还是WPS的服务器里？...

office卸载后无法重装终极解决办法

计算机启动时报警原因,电脑出现报警声怎么办？电脑出现报警声的原因

mac 百度输入法如何切换成五笔，如何切换回拼音模式

164万年后的日期解析引发的OOM

最新文章

acme cadsee 2020

CAD2012

使用.NET开发AutoCAD——设计师不做画图匠（一）

基于TOP256Y电源原理与PI Expert设计软件

KeyShot 2024 Pro for Mac v2024.1.13.0.0.92 3D渲染和动画制作软件

非常实用的电脑软件推荐

halcon教程之VisionPro软件和Halcon软件 的详细对比

lisp提取长方形坐标_求修改lisp程序，如何提取CAD中多个点的坐标，（本人想提取UCS坐标系）另外只需要提取X,Y值，不要Z...

从欧美到亚洲，2019年全球有多少个软件工程师?

6个终身受益的免费自学网站，每天花15分钟，效果立竿见影！

企业软件资产和License管理遇到的问题和解决办法

在一周内学会使用 AUTO CAD

solidwork软件安装显示失败问题处理

世界坐标系前端分类

Transformer应用到建筑行业，CAD设计起飞了

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

"Contracts and Interoperability A Conversation with Anders Hejlsberg, Part V" 阅读笔记

[Windows] 迅雷无修改无限制无视封锁

halcon教程之VisionPro软件和Halcon软件的详细对比

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载