[ACL22] HIBRIDS:Hierarchical Biases for Structure-aware Long Document Summarization 阅读笔记|电子爱好者

admin管理员组
文章数量:1566624

HIBRIDS: Attention with Hierarchical Biases
for Structure-aware Long Document Summarization [pdf]

论文状态：被ACL22接收
作者：University of Michigan的 Shuyang Cao 和 Lu Wang
TL;DR: 本文用相对关系矩阵为transformer引入文档结构信息，进而提升长文档摘要的效果，并介绍了一个新的任务：结构化＂问题-摘要对＂生成．

1. Motivation

文档的结构对于摘要是很重要的信息，如何有效地给摘要模型加入结构信息是一个有趣的问题．

受到自顶向下知识学习的启发：人们是从问宽泛的问题开始学习整体知识，再深入到细节中学习的．

于是作者提出一个新任务：给定一个文档，自动生成问题和摘要，并把＂问题-摘要对＂排列成文档的类似结构．

2. Contribution

发明了一种有效地给摘要模型提供源文档结构信息的方法：相对位置矩阵
发布了一个新的摘要任务: 生成＂问题-摘要对＂，从中提取文档的结构信息

3. Model

作者构建文档的结构树，用一个矩阵 B B B，引入了２个值来表示树结构:

PathLen(x,y)：章节x与y之间路径的长度
LvlDiff(x,y): x与ｙ在树中深度(到root的距离)的差异

对应的图：

作者以这个树结构矩阵 B B B为查询表，为transformer的attention计算方式提供额外的结构信息．

对于encoder, 给定i号查询 q i q_i qi和由输入的n个token的key组成的矩阵 K K K
更改self-attention机制为：
a i j = s o f t m a x ( q i K T + b i ) j b i = [ b i 1 , b i 2 , . . . , b i n ] a_{ij} = softmax(q_iK^T + b_i)_j \\ b_i = [b_{i1},b_{i2},...,b_{in}] aij=softmax(qiKT+bi)jbi=[bi1,bi2,...,bin]
其中，bias项的计算方式是查表:
b i j ＝ B [ PathLen ( i , j ) , LvlDiff ( i , j ) ] b_{ij}＝B[\text{PathLen}(i,j),\text{LvlDiff}(i,j) ] bij＝B[PathLen(i,j),LvlDiff(i,j)]
此外，作者还对decoder进行了设计，引入结构信息．

4. Experiments

数据的来源是GOVREPORT摘要数据集，里面是政府的报告和摘要，很长，源文档平均长度为9409,摘要平均长度为553．
作者请了11个大学生来在GOVREPORT数据集的基础上标注,标注者会根据每个摘要段落创造结构化的问题，并只能选择摘要句子作为答案.

作者的结构化＂问题-摘要对＂生成分了3个任务：

QSGen-Hier: 给定对齐的文档和根问题，生成一个能回答问题且有结构的摘要．
QSGen-ChildQ: 给定一个＂问题-摘要对＂和对齐的文档章节，生成所有的子问题．
Full Summary Generation: 生成整个长文档的摘要．

作者采用的摘要模型是Longformer，窗口长度设置为1024，在此基础上加入结构信息．
最后的实验表明，只在encoder里加结构信息貌似是最能帮助摘要生成的．

5. Key takeaways

可以通过PathLen与LvlDiff构建矩阵，表示树中节点之间的相对位置关系．
可以直接用查相对位置表的方式给Transformer引入结构信息．

本文标签：笔记 Hierarchical Biases HIBRIDS Structure

版权声明：本文标题：[ACL22] HIBRIDS:Hierarchical Biases for Structure-aware Long Document Summarization 阅读笔记内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1725840844a1044996.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

[ACL22] HIBRIDS:Hierarchical Biases for Structure-aware Long Document Summarization 阅读笔记

1. Motivation

2. Contribution

3. Model

4. Experiments

5. Key takeaways

更多相关文章

JS笔记

Figma 笔记 常用快捷键

联盛德W801系列5-微信小程序与W801蓝牙通信例程(阅读笔记)

[六点]莫烦Pytorch代码笔记

九鼎Study210嵌入式开发板刷机笔记

X Chen笔记---Centos安装XWARE使用迅雷远程下载

猫盘刷机NAS笔记(2021年最新版本)

[论文阅读笔记04]GFTE：Graph-based Financial Table Extraction

FRM P1B3笔记：Introduction to Financial Markets and Products

VDI（Virtual Desktop Infrastructure）云桌面使用笔记

笔记 |「产品经理」必懂的技术（三）

操作系统笔记——概述、进程、并发控制

html，css笔记

操作笔记 | win10 + WSL Ubuntu-20.04 + 软件安装，含apt换源操作和文件复制

Linux学习-Linux系统及编程基础笔记

恒源云GPU服务器使用笔记

谷歌浏览器的笔记在哪里_电脑使用谷歌浏览器将网页保存到有道云笔记的方法...

谷歌浏览器安装stylish插件笔记

＜＜游戏设计艺术＞＞笔记

SAP 笔记

发表评论

推荐文章

Maven - 统一构建规范：Maven 插件管理最佳实践

Linux下dd + mkisofs 制作可启动 imgiso 映像文件

Manjaro配置输入法

Objective-C 03Foundation Kit

SSD的TRIM到底是什么？

热门文章

安卓手机-百度浏览器-部分js不生效原因

讯飞输入法13.0发布，推出行业首款生成式AI输入法

Ubuntu22.04装入移动硬盘，打造随身LinuxToGo最简单的方法

图解把云服务器和办公环境服务器组成局域网

xp怎么设置计算机共享的打印机共享的打印机共享,Windows XP系统如何快速设置共享打印机？...

U盘数据恢复软件使用教程

如何在windows上本地部署SadTalker，实现AI数字人

手机里tencent文件夹能删吗_【我要删除tencent文件夹】手机删了tencent文件夹_tencent什么文件夹...

转： 大年三十整理的asp.net资料！（经典） .

VMware14虚拟机破解版安装详细教程

最新文章

回声消除技术解析

嵌入式开发工具介绍与下载

wap网站制作教程

Xcode:iOS崩溃日志分析方法

Wireshark教程：识别主机和用户

为什么中国开发不出流行的操作系统和编程语言？

WEB通信原理

Symbian财报显示手机操作系统仍&gt;&gt;&gt;&gt;Windows Mobile, Linux

Linux系统版本大全

科普：什么是小米刷机中的FASTBOOT

Windows下和程序员相关小工具

android格式化sd卡软件,如何在各种设备中把SD卡格式化？附误格式化数据恢复方法！...

阿里Qwen2-72B大模型已是开源榜的王者，为什么还要推出其他参数模型，被其他模型打榜？

Java毕设-贪吃蛇

与Mini2440开发板有关的开发操作

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

Figma 笔记常用快捷键

转：大年三十整理的asp.net资料！（经典） .

Symbian财报显示手机操作系统仍>>>>Windows Mobile, Linux

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载