web_questions

  • Description:

Cet ensemble de données se compose de 6 642 paires de questions/réponses. Les questions sont censées pouvoir être répondues par Freebase, un grand graphe de connaissances. Les questions sont principalement centrées sur une seule entité nommée. Les questions sont les plus fréquemment posées sur le Web (au moins en 2013).

Diviser Exemples
'test' 2.032
'train' 3 778
  • Caractéristiques:
FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'question': Text(shape=(), dtype=tf.string),
    'url': Text(shape=(), dtype=tf.string),
})
  • citation:
@inproceedings{berant-etal-2013-semantic,
    title = "Semantic Parsing on {F}reebase from Question-Answer Pairs",
    author = "Berant, Jonathan  and
      Chou, Andrew  and
      Frostig, Roy  and
      Liang, Percy",
    booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing",
    month = oct,
    year = "2013",
    address = "Seattle, Washington, USA",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/D13-1160",
    pages = "1533--1544",
}