- תיאור :
מערך הנתונים מכיל 5,957 שאלות רב-ברירה ארבע כיווניות. בנוסף, הם מספקים 5,167 עובדות ידע נפוץ ממקור המונים, וגרסה מורחבת של שאלות הרכבת/פיתוח/מבחן, כאשר כל שאלה קשורה לעובדת הליבה המקורית שלה, ציון דיוק אנושי, ציון בהירות ועובד קהל אנונימי תְעוּדַת זֶהוּת.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://leaderboard.allenai.org/open_book_qa/submissions/get-started
קוד מקור :
tfds.datasets.openbookqa.Builder
גרסאות :
-
0.1.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
1.38 MiB
גודל מערך נתונים :
2.40 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 500 |
'train' | 4,957 |
'validation' | 500 |
- מבנה תכונה :
FeaturesDict({
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
'clarity': float32,
'fact1': Text(shape=(), dtype=string),
'humanScore': float32,
'question': FeaturesDict({
'choice_A': Text(shape=(), dtype=string),
'choice_B': Text(shape=(), dtype=string),
'choice_C': Text(shape=(), dtype=string),
'choice_D': Text(shape=(), dtype=string),
'stem': Text(shape=(), dtype=string),
}),
'turkIdAnonymized': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
מקש מענה | ClassLabel | int64 | ||
בְּהִירוּת | מוֹתֵחַ | לצוף32 | ||
עובדה 1 | טֶקסט | חוּט | ||
humanScore | מוֹתֵחַ | לצוף32 | ||
שְׁאֵלָה | FeaturesDict | |||
שאלה/בחירה_א | טֶקסט | חוּט | ||
שאלה/בחירה_ב | טֶקסט | חוּט | ||
שאלה/בחירה_ג | טֶקסט | חוּט | ||
שאלה/בחירה_D | טֶקסט | חוּט | ||
שאלה/גזע | טֶקסט | חוּט | ||
turkIdAnonymized | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('question', 'answerKey')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@article{mihaylov2018can,
title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
journal={arXiv preprint arXiv:1809.02789},
year={2018}
}