- תיאור :
Cosmos QA הוא מערך נתונים בקנה מידה גדול של 35.6K בעיות הדורשות הבנת הנקרא מבוססת היגיון, מנוסח כשאלות רב-ברירה. הוא מתמקד בקריאה בין השורות על פני אוסף מגוון של נרטיבים יומיומיים של אנשים, ושואל שאלות הנוגעות לסיבות או השפעות סבירות של אירועים הדורשים היגיון מעבר לטווחי הטקסט המדויקים בהקשר.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://wilburone.github.io/cosmos/
קוד מקור :
tfds.question_answering.CosmosQA
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
23.27 MiB
גודל ערכת נתונים:
27.09 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 6,963 |
'train' | 25,262 |
'validation' | 2,985 |
- מבנה תכונה :
FeaturesDict({
'answer0': Text(shape=(), dtype=string),
'answer1': Text(shape=(), dtype=string),
'answer2': Text(shape=(), dtype=string),
'answer3': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=4),
'question': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תשובה0 | טֶקסט | חוּט | ||
תשובה 1 | טֶקסט | חוּט | ||
תשובה 2 | טֶקסט | חוּט | ||
תשובה 3 | טֶקסט | חוּט | ||
הֶקשֵׁר | טֶקסט | חוּט | ||
תְעוּדַת זֶהוּת | טֶקסט | חוּט | ||
תווית | ClassLabel | int64 | ||
שְׁאֵלָה | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@inproceedings{huang-etal-2019-cosmos,
title = "Cosmos {QA}: Machine Reading Comprehension with Contextual Commonsense Reasoning",
author = "Huang, Lifu and
Le Bras, Ronan and
Bhagavatula, Chandra and
Choi, Yejin",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
year = "2019",
url = "https://www.aclweb.org/anthology/D19-1243"
}