论文 | DEMONSTRATE–SEARCH–PREDICT: Composing retrieval and language models for knowledge-intensive NLP|电子爱好者

admin管理员组
文章数量:1633262

论文摘要

这篇论文提出了 DSP (DEMONSTRATE–SEARCH–PREDICT) 框架，用于在知识密集型 NLP 任务中，将检索模型 (RM) 和语言模型 (LM) 进行有效结合。DSP 框架通过在 LM 和 RM 之间传递自然语言文本，实现更复杂的交互，从而更好地利用两者的优势。DSP 框架使用一系列可组合的函数，用于实现演示、检索和预测三个阶段的任务，并通过弱监督学习的方法自动标注演示数据，从而降低标注成本。实验结果表明，DSP 框架在开放域问答、多跳问答和对话问答等任务上取得了优于传统方法的性能。

DSP 框架主要针对以下问题进行优化和改进：

1、知识密集型任务：

问题：知识密集型 NLP 任务 (例如问答、事实核查、信息检索等) 通常需要大量的知识，而预训练语言模型 (LM) 中的知识往往是不完整和不可靠的。

改进：DSP 框架通过引入检索模型 (RM)，可以有效地利用外部知识库中的知识，从而提高 LM 在知识密集型任务上的性能。

2、中间步骤标注：

问题：在传统的 NLP 任务中，中间步骤 (例如多跳问答中的各个查询) 通常需要人工标注，这需要大量的时间和精力。

改进：DSP 框架使用弱监督学习的方法，可以自动标注中间步骤，从而降低标注成本，提高标注效率。

3、模型泛化能力：

问题：预训练语言模型 (LM) 的泛化能力有限，难以适应新的任务和数据集。

改进：DSP 框架通过使用零样本学习和可组合的函数，可以增强模型的泛化能力，使其能够适应不同的任务和数据集。

4、模型可解释性：

问题：预训练语言模型 (LM) 的预测结果往往缺乏可解释性，难以理解模型是如何得出预测结果的。

改进：DSP 框架通过检索到的段落作为证据，可以解释模型的预测结果，从而提高模型的可解释性。

主要贡献：

提出DSP架构，该架构用于上下文学习，完全依赖于在冻结的检索模型和语言模型之间做交互（传递自然语言文本或者分数）。此外，DSP还引入了一系列可组合的功能，用于实现演示、检索和预测三个阶段的任务。
使用弱监督学习的方法，自动标注演示数据，降低标注成本。
在开放域问答、多跳问答和对话问答等任务上取得了优于传统方法的性能。

DSP架构

DSP 框架的核心思想是将检索模型 (RM) 和语言模型 (LM) 协同工作，通过三个阶段的流程来实现更复杂的 NLP 任务。

DEMONSTRATE (演示阶段):

目标：生成演示，用于引导LM适应特定任务。
方法：使用弱监督学习，从标注数据中自动生成演示。
优点：不需要人工手动标注演示，减少标注成本；易于扩展，可以适应不同的任务和数据集。

SEARCH (检索阶段):

目标：使用检索模型检索与任务相关的段落。
方法：根据语言模型生成的问题或者查询，使用RM检索相关段落，并将其作为上下文传递给语言模型。
优点：提高了语言模型的推理能力，使其能够更好地理解问题和答案之间的关系。

PREDICT (预测阶段):

目标：使用演示和检索到的段落，生成最终答案或者预测。
方法：使用语言模型生成答案或者预测，并利用检索到的段落作为证据，解释模型的预测结果。
优点：提高预测的可靠性和可解释性。

关于弱监督学习方法实现自动标注数据：

弱监督学习 是一种利用弱标签 (例如答案) 来训练模型的方法。在 DSP 中，弱标签是指任务的最终目标，例如多跳问答中的答案。

DSP自动标注数据流程如下（生成中间步骤）：

1.选择训练数据: 从训练集中选择一部分数据，用于生成演示。

2.执行零样本学习: 使用 LM 对训练数据进行零样本学习，并尝试回答问题或执行其他任务。

3.缓存中间结果: 将 LM 生成的问题、查询、段落、摘要等中间结果进行缓存。

4.评估结果: 评估 LM 的预测结果是否正确。

5.生成演示: 如果预测结果正确，则将缓存的中间结果作为演示添加到训练数据中。

本文标签：论文 Predict Composing Search retrieval

版权声明：本文标题：论文 | DEMONSTRATE–SEARCH–PREDICT: Composing retrieval and language models for knowledge-intensive NLP 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1729167488a1188371.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

论文 | DEMONSTRATE–SEARCH–PREDICT: Composing retrieval and language models for knowledge-intensive NLP

论文摘要

DSP 框架主要针对以下问题进行优化和改进：

1、知识密集型任务：

2、中间步骤标注：

3、模型泛化能力：

4、模型可解释性：

主要贡献：

DSP架构

DEMONSTRATE (演示阶段):

SEARCH (检索阶段):

PREDICT (预测阶段):

关于弱监督学习方法实现自动标注数据：

DSP自动标注数据流程如下（生成中间步骤）：

更多相关文章

【论文阅读】Learning Distinctive Margin toward Active Domain Adaptation中categorical-wise margin loss的作用

[论文工具] LaTeX论文撰写常见用法及实战技巧归纳（持续更新）

图像匹配论文与方法超全整理

CVPR2022最新106篇论文整理｜包含目标检测、动作识别、图像处理等32个方向

CVPR2022论文列表（中英对照）

【CVPR2022】论文列表与下载——PartThree

Attention Is All You Need-论文解读（不含实验）

【论文阅读】Deep Learning Workload Scheduling in GPU Datacenters:Taxonomy, Challenges and Vision

【人工智能概论】 Transformer论文翻译与粗浅解读

优化｜运筹学应用之顶刊Operations Research论文综述(68(6)期)

Transformer论文翻译

NLP系列经典论文(1)-- Attention Is All You Need

论文Summary03——TAP规则脆弱性静态修复

[论文翻译]Attention Is All You Need

教你用Elastic Search：运行第一条Hello World搜索命令

Chinese American literature appearances 转自金牌论文

AI论文神器ChatGPT：让你的学术写作如虎添翼

【GNN】高被引图神经网络（GNN）全面综述论文

KDD2021| 工业界搜推广nlp论文整理

论文 | DEMONSTRATE–SEARCH–PREDICT: Composing retrieval and language models for knowledge-intensive NLP

发表评论

推荐文章

安卓11到鸿蒙系统,EMUI11相当于是一个，从安卓到鸿蒙，过渡得一个阶段

ChatGPT出现500.504错误

博文汇总

2023年最新qq空间说说怎么全部删除_QQ空间说说如何批量删除

【深度强化学习】如何平衡cpu和gpu来加快训练速度（实录）

热门文章

推荐8款在win11上还能用的“古董级”软件

Mac电脑如何查看配置

如何在MAC电脑上安装及配置Android Studio（史上最完整）

向日葵windows 控制 ubuntu 显示连接已断开 解决方案

android p nexus10,再造安卓最强 谷歌Nexus 10平板全解析

VMware网络配置

关于Nginx：Nginx在windows上安装及Nginx的配置和优化

vue.js报错：Templates should only be responsible for mapping the state to the UI...

模拟登录qq网页版方法

r运行太慢怎么办

最新文章

ThinkPHP 6.0 使用笔记 - 重写路由 隐藏入口文件index.php

Android网络框架(二)——策略路由与常用命令

路由守卫-vue切换路由登录判断、条件判断

vue实现动态路由一步到位

vue3路由（基本用法、路由守卫、动态路由）

vue3路由基本使用

《路由协议与交换技术》重点知识总结（路由交换知识点）

vue项目多页面，多入口，多路由，多主题解决方案（vuecli3）

【Vue实战教程】之 Vue Router 路由详解

cleanmymacX和腾讯柠檬到底哪个好用 2024最新使用测评

React利用路由实现登录界面的跳转

Linux双网卡同网段使用策略路由控制流量哪张网卡进就哪张网卡出

静态路由（也许是目前最全的）

路由技术 -- 路由策略（Routing Policy）与策略路由（PBR,Policy-based Routing）技术

PRD：腾讯会议APP产品需求文档

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

向日葵windows 控制 ubuntu 显示连接已断开解决方案

android p nexus10,再造安卓最强谷歌Nexus 10平板全解析

ThinkPHP 6.0 使用笔记 - 重写路由隐藏入口文件index.php

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载