- Açıklama:
Cosmos QA, çoktan seçmeli sorular olarak formüle edilmiş, sağduyuya dayalı okuduğunu anlama gerektiren 35.6K problemden oluşan büyük ölçekli bir veri kümesidir. İnsanların günlük anlatılarından oluşan çeşitli bir koleksiyon üzerinde satır aralarını okumaya, bağlamdaki kesin metin alanlarının ötesinde akıl yürütme gerektiren olayların olası nedenleri veya etkileriyle ilgili sorular sormaya odaklanır.
Anasayfa: https://wilburone.github.io/cosmos/
Kaynak kodu:
tfds.question_answering.CosmosQA
sürümleri:
-
1.0.0
(varsayılan): Hayır sürüm notları.
-
İndirme boyutu:
23.27 MiB
Veri kümesi boyutu:
27.09 MiB
Otomatik önbelleğe ( dokümantasyon ): Evet
Splits:
Bölmek | Örnekler |
---|---|
'test' | 6.963 |
'train' | 25.262 |
'validation' | 2.985 |
- Özellikler:
FeaturesDict({
'answer0': Text(shape=(), dtype=tf.string),
'answer1': Text(shape=(), dtype=tf.string),
'answer2': Text(shape=(), dtype=tf.string),
'answer3': Text(shape=(), dtype=tf.string),
'context': Text(shape=(), dtype=tf.string),
'id': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'question': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): desteklenmez.
Örnekler ( tfds.as_dataframe ):
- Citation:
@inproceedings{huang-etal-2019-cosmos,
title = "Cosmos {QA}: Machine Reading Comprehension with Contextual Commonsense Reasoning",
author = "Huang, Lifu and
Le Bras, Ronan and
Bhagavatula, Chandra and
Choi, Yejin",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
year = "2019",
url = "https://www.aclweb.org/anthology/D19-1243"
}