cifar10_1

מערך הנתונים של CIFAR-10.1 הוא ערכת בדיקות חדשה עבור CIFAR-10. CIFAR-10.1 מכיל בערך 2,000 תמונות בדיקה חדשות שנדגמו לאחר שנים רבות של מחקר על מערך הנתונים המקורי של CIFAR-10. איסוף הנתונים עבור CIFAR-10.1 תוכנן כדי למזער שינוי תפוצה ביחס למערך הנתונים המקורי. אנו מתארים את היצירה של CIFAR-10.1 במאמר "האם מסווגי CIFAR-10 מכלילים ל-CIFAR-10?". התמונות ב-CIFAR-10.1 הן תת-קבוצה של מערך הנתונים של TinyImages. ישנן כרגע שתי גרסאות של מערך הנתונים CIFAR-10.1: v4 ו-v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
תמונה תמונה (32, 32, 3) uint8
תווית ClassLabel int64
  • מפתחות בפיקוח (ראה as_supervised doc ): ('image', 'label')

  • ציטוט :

@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (תצורת ברירת המחדל)

  • תיאור תצורה : זוהי הגרסה הראשונה של מערך הנתונים שלנו שעליה בדקנו כל מסווג. כפי שהוזכר לעיל, זה הופך את מערך הנתונים v4 לבלתי תלוי במסווגים שאנו מעריכים. המספרים המדווחים בחלקים הראשיים של המאמר שלנו משתמשים בגרסה זו של מערך הנתונים. הוא נבנה מ-25 מילות המפתח המובילות של TinyImages עבור כל מחלקה, מה שהוביל לחוסר איזון קל בכיתה. ההבדל הגדול ביותר הוא שספינות מהוות רק 8% ממערך הבדיקות במקום 10%. v4 מכיל 2,021 תמונות.

  • גודל הורדה : 5.93 MiB

  • גודל מערך נתונים : 4.46 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 2,021

רְאִיָה

cifar10_1/v6

  • תיאור תצורה : היא נגזרת מהקצאת מילות מפתח משופרת במקצת, המאוזנת בדיוק בכיתה. גרסה זו של מערך הנתונים תואמת את התוצאות בנספח D של המאמר שלנו. v6 מכיל 2,000 תמונות.

  • גודל הורדה : 5.87 MiB

  • גודל ערכת נתונים : 4.40 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 2,000

רְאִיָה