- תיאור:
Cosmos QA הוא מערך נתונים רחב היקף של 35.6K בעיות הדורשות הבנת קריאה מבוססת-השכל, שנוסחו כשאלות בחירה מרובות. הוא מתמקד בקריאה בין השורות על אוסף מגוון של נרטיבים יומיומיים של אנשים, ושאל שאלות בנוגע לסיבות או לתוצאות סבירות של אירועים הדורשים נימוקים מעבר לטווחי הטקסט המדויקים בהקשר.
דף הבית: https://wilburone.github.io/cosmos/
קוד מקור:
tfds.question_answering.CosmosQA
גרסאות:
-
1.0.0
(ברירת המחדל): הערות השחרור לא.
-
גודל ההורדה:
23.27 MiB
מערך נתונים גודל:
27.09 MiB
Auto-במטמון ( תיעוד ): כן
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'test' | 6,963 |
'train' | 25,262 |
'validation' | 2,985 |
- מאפיינים:
FeaturesDict({
'answer0': Text(shape=(), dtype=tf.string),
'answer1': Text(shape=(), dtype=tf.string),
'answer2': Text(shape=(), dtype=tf.string),
'answer3': Text(shape=(), dtype=tf.string),
'context': Text(shape=(), dtype=tf.string),
'id': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'question': Text(shape=(), dtype=tf.string),
})
מפתחות השגחה (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט:
@inproceedings{huang-etal-2019-cosmos,
title = "Cosmos {QA}: Machine Reading Comprehension with Contextual Commonsense Reasoning",
author = "Huang, Lifu and
Le Bras, Ronan and
Bhagavatula, Chandra and
Choi, Yejin",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
year = "2019",
url = "https://www.aclweb.org/anthology/D19-1243"
}