- תיאור :
מערך הנתונים של CIFAR-10.1 הוא ערכת בדיקות חדשה עבור CIFAR-10. CIFAR-10.1 מכיל בערך 2,000 תמונות בדיקה חדשות שנדגמו לאחר שנים רבות של מחקר על מערך הנתונים המקורי של CIFAR-10. איסוף הנתונים עבור CIFAR-10.1 תוכנן כדי למזער שינוי תפוצה ביחס למערך הנתונים המקורי. אנו מתארים את היצירה של CIFAR-10.1 במאמר "האם מסווגי CIFAR-10 מכלילים ל-CIFAR-10?". התמונות ב-CIFAR-10.1 הן תת-קבוצה של מערך הנתונים של TinyImages. ישנן כרגע שתי גרסאות של מערך הנתונים CIFAR-10.1: v4 ו-v6.
קוד מקור :
tfds.image_classification.Cifar10_1
גרסאות :
-
1.1.0
(ברירת מחדל): אין הערות שחרור.
-
שמירה אוטומטית במטמון ( תיעוד ): כן
מבנה תכונה :
FeaturesDict({
'image': Image(shape=(32, 32, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תמונה | תמונה | (32, 32, 3) | uint8 | |
תווית | ClassLabel | int64 |
מפתחות בפיקוח (ראה
as_supervised
doc ):('image', 'label')
ציטוט :
@article{recht2018cifar10.1,
author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
year = {2018},
note = {\url{https://arxiv.org/abs/1806.00451} },
}
@article{torralba2008tinyimages,
author = {Antonio Torralba and Rob Fergus and William T. Freeman},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
year = {2008},
volume = {30},
number = {11},
pages = {1958-1970}
}
cifar10_1/v4 (תצורת ברירת המחדל)
תיאור תצורה : זוהי הגרסה הראשונה של מערך הנתונים שלנו שעליה בדקנו כל מסווג. כפי שהוזכר לעיל, זה הופך את מערך הנתונים v4 לבלתי תלוי במסווגים שאנו מעריכים. המספרים המדווחים בחלקים הראשיים של המאמר שלנו משתמשים בגרסה זו של מערך הנתונים. הוא נבנה מ-25 מילות המפתח המובילות של TinyImages עבור כל מחלקה, מה שהוביל לחוסר איזון קל בכיתה. ההבדל הגדול ביותר הוא שספינות מהוות רק 8% ממערך הבדיקות במקום 10%. v4 מכיל 2,021 תמונות.
גודל הורדה :
5.93 MiB
גודל מערך נתונים :
4.46 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 2,021 |
- איור ( tfds.show_examples ):
- דוגמאות ( tfds.as_dataframe ):
cifar10_1/v6
תיאור תצורה : היא נגזרת מהקצאת מילות מפתח משופרת במקצת, המאוזנת בדיוק בכיתה. גרסה זו של מערך הנתונים תואמת את התוצאות בנספח D של המאמר שלנו. v6 מכיל 2,000 תמונות.
גודל הורדה :
5.87 MiB
גודל מערך נתונים :
4.40 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 2,000 |
- איור ( tfds.show_examples ):
- דוגמאות ( tfds.as_dataframe ):