数据集"/>
对话数据集
A Natural Language Corpus of Common Grounding underContinuous and Partially-Observable Context
任务:根据对话描述,找出两个speaker可以共同看见的实体
构建6760对话数据集
.03399
RadioTalk: a large-scale corpus of talk radio transcripts
无线电转录的大量对话数据集
284000无线电自动转录语音
.07073
- Large Scale Question Answering using Tourism Data
标题:基于旅游数据的大规模问答
作者: Danish Contractor, Parag Singla
链接:.03527
我们收集了一份QA数据集,其中包含48,147个段落大小的真实用户问题,这些问题来自寻求酒店,景点和餐馆推荐的旅行者。每个候选答案都与一组非结构化评论相关联。
- Taskmaster-1: Toward a Realistic and Diverse Dialog Dataset
标题:Taskmaster-1:走向现实和多样化的对话数据集
作者: Bill Byrne, Kyu-Young Kim
备注:To appear at EMNLP 2019
链接:.05358
其中包括13,215个基于任务的对话框,包含六个域。
-
Generating Challenge Datasets for Task-Oriented Conversational Agents through Self-Play
标题:通过自玩为面向任务的会话代理生成挑战数据集
作者: Sourabh Majumdar, Serra Sinem Tekiroglu
备注:Proceedings of Recent Advances in Natural Language Processing (RANLP) Conference, 2019
链接:.07357
-
The Eighth Dialog System Technology Challenge
标题:第八届对话系统技术挑战
作者: Seokhwan Kim, Raghav Gupta
备注:Submitted to NeurIPS 2019 3rd Conversational AI Workshop
链接:.06394
-
The JDDC Corpus: A Large-Scale Multi-Turn Chinese Dialogue Dataset forE-commerce Customer Service
标题:JDDC语料库:一个大规模的多回合中文对话数据集电子商务客户服务
作者: Meng Chen, Bowen Zhou
链接:.09969
-
Filling Conversation Ellipsis for Better Social Dialog Understanding
标题:填充会话省略以更好地理解社会对话
作者: Xiyuan Zhang, Zhou Yu
备注:Accepted to AAAI 2020
链接:.10776
针对于省略号问题,我们还提供了一个开放域的人机对话数据集,其中包含手动完成的用户话语和手动完成后的带注释的语义角色标签。
-
SAMSum Corpus: A Human-annotated Dialogue Dataset for Abstractive Summarization
标题:SAMSum语料库:用于摘要的人类标注对话数据集
作者: Bogdan Gliwa, Aleksander Wawer
链接:.12237
-
Introducing MANtIS: a novel Multi-Domain Information Seeking Dialogues Dataset
标题:介绍螳螂:一种新的多领域信息搜索对话数据集
作者: Gustavo Penha, Claudia Hauff
链接:.04639
-
Characterizing the dynamics of learning in repeated reference games
标题:在重复参照游戏中刻画学习的动力
作者: Robert D. Hawkins, Noah D. Goodman
链接:.07199
-
I love your chain mail! Making knights smile in a fantasy game world: Open-domain goal-orientated dialogue agents
标题:我喜欢你的锁甲!让骑士在幻想游戏世界中微笑:开放领域目标导向的对话代理
作者:Shrimai Prabhumoye, Arthur Szlam
链接:.02878
-
WAC: A Corpus of Wikipedia Conversations for Online Abuse Detection
标题:WAC:用于在线滥用检测的维基百科对话语料库
作者:Noé Cecillon (LIA), Georges Linares (LIA)
链接:.06190
-
MedDialog: A Large-scale Medical Dialogue Dataset
标题:MedDialog:一个大规模医学对话数据集
作者: Shu Chen, Pengtao Xie
链接:.03329
-
KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn Knowledge-driven Conversation
标题:KdConv:一个面向多轮知识驱动会话的中文多域对话数据集
作者: Hao Zhou, Xiaoyan Zhu
链接:.04100
-
Molweni: A Challenge Multiparty Dialogues-based Machine Reading Comprehension Dataset with Discourse Structure
标题:Molweni:一个具有语篇结构的基于多方对话的机器阅读理解数据集
作者: Jiaqi Li, Bing Qin
链接:.05080
-
A New Dataset for Natural Language Inference from Code-mixed Conversations
标题:一种新的基于代码混合会话的自然语言推理数据集
作者: Simran Khanuja, Monojit Choudhury
备注:To appear in CALCS, LREC 2020
链接:.05051
-
Dialogue-Based Relation Extraction
标题:基于对话的关系抽取
作者:Dian Yu, Dong Yu
备注:To appear in ACL 2020
链接:.08056
-
Grounding Conversations with Improvised Dialogues
标题:以即兴对话为基础的对话
作者: Hyundong Cho, Jonathan May
备注:ACL2020; 9 pages + 1 page appendix
链接:.09544
-
更多推荐
对话数据集
发布评论