对话数据集

编程入门行业动态更新时间:2024-10-07 22:24:02

对话<a href=https://www.elefans.com/category/jswz/34/1771445.html style= 数据集"/>

对话数据集

A Natural Language Corpus of Common Grounding underContinuous and Partially-Observable Context

任务：根据对话描述，找出两个speaker可以共同看见的实体

构建6760对话数据集

.03399

RadioTalk: a large-scale corpus of talk radio transcripts

无线电转录的大量对话数据集

284000无线电自动转录语音

.07073

Large Scale Question Answering using Tourism Data

标题：基于旅游数据的大规模问答

作者： Danish Contractor, Parag Singla

链接：.03527

我们收集了一份QA数据集，其中包含48,147个段落大小的真实用户问题，这些问题来自寻求酒店，景点和餐馆推荐的旅行者。每个候选答案都与一组非结构化评论相关联。

Taskmaster-1: Toward a Realistic and Diverse Dialog Dataset

标题：Taskmaster-1：走向现实和多样化的对话数据集

作者： Bill Byrne, Kyu-Young Kim

备注：To appear at EMNLP 2019

链接：.05358

其中包括13,215个基于任务的对话框，包含六个域。

Generating Challenge Datasets for Task-Oriented Conversational Agents through Self-Play

标题：通过自玩为面向任务的会话代理生成挑战数据集

作者： Sourabh Majumdar, Serra Sinem Tekiroglu

备注：Proceedings of Recent Advances in Natural Language Processing (RANLP) Conference, 2019

链接：.07357
The Eighth Dialog System Technology Challenge

标题：第八届对话系统技术挑战

作者： Seokhwan Kim, Raghav Gupta

备注：Submitted to NeurIPS 2019 3rd Conversational AI Workshop

链接：.06394
The JDDC Corpus: A Large-Scale Multi-Turn Chinese Dialogue Dataset forE-commerce Customer Service

标题：JDDC语料库：一个大规模的多回合中文对话数据集电子商务客户服务

作者： Meng Chen, Bowen Zhou

链接：.09969
Filling Conversation Ellipsis for Better Social Dialog Understanding

标题：填充会话省略以更好地理解社会对话

作者： Xiyuan Zhang, Zhou Yu

备注：Accepted to AAAI 2020

链接：.10776

针对于省略号问题，我们还提供了一个开放域的人机对话数据集，其中包含手动完成的用户话语和手动完成后的带注释的语义角色标签。

SAMSum Corpus: A Human-annotated Dialogue Dataset for Abstractive Summarization

标题：SAMSum语料库：用于摘要的人类标注对话数据集

作者： Bogdan Gliwa, Aleksander Wawer

链接：.12237
Introducing MANtIS: a novel Multi-Domain Information Seeking Dialogues Dataset

标题：介绍螳螂：一种新的多领域信息搜索对话数据集

作者： Gustavo Penha, Claudia Hauff

链接：.04639
Characterizing the dynamics of learning in repeated reference games

标题：在重复参照游戏中刻画学习的动力

作者： Robert D. Hawkins, Noah D. Goodman

链接：.07199
I love your chain mail! Making knights smile in a fantasy game world: Open-domain goal-orientated dialogue agents

标题：我喜欢你的锁甲！让骑士在幻想游戏世界中微笑：开放领域目标导向的对话代理

作者：Shrimai Prabhumoye, Arthur Szlam

链接：.02878
WAC: A Corpus of Wikipedia Conversations for Online Abuse Detection

标题：WAC：用于在线滥用检测的维基百科对话语料库

作者：Noé Cecillon (LIA), Georges Linares (LIA)

链接：.06190
MedDialog: A Large-scale Medical Dialogue Dataset

标题：MedDialog：一个大规模医学对话数据集

作者： Shu Chen, Pengtao Xie

链接：.03329
KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn Knowledge-driven Conversation

标题：KdConv：一个面向多轮知识驱动会话的中文多域对话数据集

作者： Hao Zhou, Xiaoyan Zhu

链接：.04100
Molweni: A Challenge Multiparty Dialogues-based Machine Reading Comprehension Dataset with Discourse Structure

标题：Molweni：一个具有语篇结构的基于多方对话的机器阅读理解数据集

作者： Jiaqi Li, Bing Qin

链接：.05080
A New Dataset for Natural Language Inference from Code-mixed Conversations

标题：一种新的基于代码混合会话的自然语言推理数据集

作者： Simran Khanuja, Monojit Choudhury

备注：To appear in CALCS, LREC 2020

链接：.05051
Dialogue-Based Relation Extraction

标题：基于对话的关系抽取

作者：Dian Yu, Dong Yu

备注：To appear in ACL 2020

链接：.08056
Grounding Conversations with Improvised Dialogues

标题：以即兴对话为基础的对话

作者： Hyundong Cho, Jonathan May

备注：ACL2020; 9 pages + 1 page appendix

链接：.09544