A Diversity-Promoting Objective Function for Neural Conversation Models|电子爱好者

admin管理员组
文章数量:1564668

该论文提出了基于最大互信息（Maximum Mutual Information—MMI）的期望计算思想。

传统的生成模型计算方式是：target = argmax（logP（T|S）），即在source给定的条件下，寻找出最大概率的target。
这样的计算方式所带来的问题是会生成一般性的，具有大概率事件的target，失去了target的多样性。
由互信息公式得：
该论文基于MMI思想，提出了新的target计算方式，即：
target = argmax{logP（T|S） - logP（T））} ===加入权重系数===》：
（公式1）target = argmax{logP（T|S） - r*logP（T）} (r为超参数，可理解r*logP（T）为对target生成概率的惩罚值)
公式（1）经过Bayes公式的变形可转化为：
（公式2）target = argmax{（1-r）*logP(T|S) + r*logP(S|T））}
（推导：）

MMI训练中的问题，将MMI运用到Seq2Seq模型中想法很好，但需要得到超参数r，我们不可能通过不断地尝试，每次都重新训练一个模型，那样太耗时了。所以建议只是在Decode时使用MMI。

公式（1）中，在MMI的运用实践中，加入惩罚因素r*logP（T）确实可以使回复变得多样性，但也趋向于生成不符合语法的句子（该问题使用MMI-anti表示）。实验中可以发现，第一个token的生成相比后面token的生成更依赖前一序列，在第一个token生成中加入惩罚值，可以提高生成的多样性，而如果在后续token中加入惩罚因素，生成的序列越长，就越容易导致生成sequence语法的不通畅。所以将之前固定的惩罚因子替换为随着序列生成递减的因子g(k)。

如果使用公式（2），在logP(S|T)部分中，需要在Target序列生成前计算P(S|T)，而T的空间范围非常大（即需要找出生成T的所有可能），所以计算起来异常复杂耗时。这样的话，可以使用一般的Seq2Seq模型预先生成前N-best的序列集，作为T的选择空间。

本文标签： Objective Promoting Diversity function Models

版权声明：本文标题：A Diversity-Promoting Objective Function for Neural Conversation Models 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1725456413a1024245.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

A Diversity-Promoting Objective Function for Neural Conversation Models

更多相关文章

解决 错误 C4996 ‘ctime‘: This function or variable may be unsafe. Consider using ctime_s instead.

解决C4996 ‘fopen‘: This function or variable may be unsafe. Consider using fopen_s instead.

解决VS编译报错C4996 ‘fopen‘: This function or variable may be unsafe. Consider using fopen_s instead...

VS报错记录001——C4996: fopen‘: This function or variable may be unsafe. Consider using fopen s instead,

C4996 ‘scanf‘: This function or variable may be unsafe. Consider using scanf_s instead. To disable d

VS2022中‘setbuf‘: This function or variable may be unsafe. Consider using setvbuf instead.报错问题

C4996 ‘scanf‘: This function or variable may be unsafe. Consider using scanf_s instead.

C4996 ‘scanf‘: This function or variable may be unsafe. Consider using scanf_s (vs中提示错误:scanf函数)

‘strtok‘: This function or variable may be unsafe. Consider using strtok_s instead.

错误C4996 ‘fopen‘: This function or variable may be unsafe. Consider using fopen_s instead

关于VS scanf出现‘scanf‘: This function or variable may be unsafe. Consider usi问题的解决方法

报错-C4996 ‘fopen‘: This function or variable may be unsafe. Consider using fopen_s instead. 解决办法

Immediately-Invoked Function Expression (IIFE)

GOT-10k: A Large High-Diversity Benchmark forGeneric Object Tracking in the Wild（论文翻译）

Unhandled error during execution of render function

Multimodal Chain-of-Thought Reasoning in Language Models阅读笔记

论文阅读：Self-Consistency Improves Chain of Thought Reasoning in Language Models

Financial Statement Analysis with Large Language Models论文精读

Refactor this function to reduce its Cognitive Complexity from 40 to the 30 allowed

使用Azure Function + Cognitive Services 实现图片自动化审核

发表评论

推荐文章

不能掌握Linux的人为什么总被说智商低？

【电脑浏览器不能上网，显示远程计算机或设备将不接收连接的解决办法】

折腾树莓派（六）在树莓派上使用迅雷远程下载

网易云音乐软件没有视频的版本

应用程序无法正常启动（0xC0000142）

热门文章

Ubuntu14.04系统登录密码正确进不了桌面死循环问题

Ubuntu18.04循环登录卡在开机界面无法进入图形界面的问题

计算机视觉中，目前有哪些经典的目标跟踪算法？

连接图书馆wifi无法验证如何解决

Windows 10 IoT Enterprise 2019 LTSC High End OEM Software 详细介绍

我是如何使用python控制迅雷自动下载电影的?

云计算防止入坑之通过跑分看云服务器的性能，给各位云计算入门者的一些建议

【实用技巧】下载音乐到本地电脑

华为入局商用市场：趋势使然，挑战颇多

创建你的输入法高级自定义短语（以PC版百度拼音输入法为例）

最新文章

centos7中文输入法

软件发明专利实例_上知案例洞察：搜狗诉百度输入法软件发明专利侵权纠纷案...

Ubuntu设置中文输入法教程（全）

Ubuntu20.04安装中文输入法

用输入法打出希腊字母

rk android10.1 默认输入法 百度tv输入法

Centos7安装输入法

deepin 20.9中文输入法问题

为什么php-fpm会使用内存一直增加_百度输入法重大BUG：内存占用随用户词库增大而暴涨...

Ubuntu 24.04 输入法配置

用百度输入法的用户体验

android 百度轻量输入法,百度发布Android手机输入法 打造流畅体验

MIUI 13 去除输入法广告

Jmeter与搜狗输入法、百度输入法不兼容问题解决方法

Ubuntu下微信（wechat）经常无故卡死解决方法百度输入法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

解决错误 C4996 ‘ctime‘: This function or variable may be unsafe. Consider using ctime_s instead.

rk android10.1 默认输入法百度tv输入法

android 百度轻量输入法,百度发布Android手机输入法打造流畅体验

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载