cosmos_qa

  • Description:

Cosmos QA est un ensemble de données à grande échelle de 35,6 000 problèmes qui nécessitent une compréhension écrite fondée sur le bon sens, formulés sous forme de questions à choix multiples. Il se concentre sur la lecture entre les lignes d'une collection diversifiée de récits quotidiens de personnes, posant des questions sur les causes ou les effets probables d'événements qui nécessitent un raisonnement au-delà de la portée exacte du texte dans le contexte.

Diviser Exemples
'test' 6 963
'train' 25 262
'validation' 2 985
  • Caractéristiques:
FeaturesDict({
    'answer0': Text(shape=(), dtype=tf.string),
    'answer1': Text(shape=(), dtype=tf.string),
    'answer2': Text(shape=(), dtype=tf.string),
    'answer3': Text(shape=(), dtype=tf.string),
    'context': Text(shape=(), dtype=tf.string),
    'id': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'question': Text(shape=(), dtype=tf.string),
})
  • citation:
@inproceedings{huang-etal-2019-cosmos,
    title = "Cosmos {QA}: Machine Reading Comprehension with Contextual Commonsense Reasoning",
    author = "Huang, Lifu  and
      Le Bras, Ronan  and
      Bhagavatula, Chandra  and
      Choi, Yejin",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
    year = "2019",
    url = "https://www.aclweb.org/anthology/D19-1243"
}