Maluuba News QA 数据集:CNN 新闻文章中的 12 万个问答对。 地址:https://datasets.maluuba.com/NewsQA
Quora 问答对:Quora 发布的第一个数据集,包含重复/语义相似性标签。 地址:https://data.quora.com/First-Quora-Dataset-Release-Question-Pairs
CMU Q / A 数据集:手动生成的仿真问/答对,维基百科文章对其难度评分很高。 地址:http://www.cs.cmu.edu/~ark/QA-data/
Maluuba 面向目标的对话:程序性对话数据集,对话旨在完成任务或做出决定。常用于聊天机器人。 地址:https://datasets.maluuba.com/Frames
bAbi:来自 Facebook AI Research(FAIR)的综合阅读理解和问答数据集。 地址:https://research.fb.com/projects/babi/
The Children’s Book Test:Project Gutenberg 提供的儿童图书中提取的(问题+背景、答案)对的基线。用于问答(阅读理解)和仿真查找。 地址:http://www.thespermwhale.com/jaseweston/babi/CBTest.tgz
???