imagenet2012_subset

Imagenet2012Subset הוא קבוצת משנה של מערך הנתונים המקורי של ImageNet ILSVRC 2012. מערך הנתונים חולק את אותה ערכת אימות כמו מערך הנתונים המקורי של ImageNet ILSVRC 2012. עם זאת, ערכת האימונים מסומנת בתת-דגימה בצורה מאוזנת בתווית. בתצורת 1pct , 1%, או 12811, תמונות נדגמות, לרוב המחלקות יש את אותו מספר תמונות (ממוצע 12.8), לחלקות מסוימות יש באופן אקראי דוגמה אחת יותר מאחרות; ובתצורה של 10pct , ~10%, או 128116, לרוב המחלקות יש את אותו מספר תמונות (ממוצע 128), ולחלק מהמעמדות יש באופן אקראי דוגמה אחת יותר מאחרות.

זה אמור לשמש כמדד ללמידה בפיקוח למחצה, והוא שימש במקור במאמר SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • דף הבית : http://image-net.org/

  • קוד מקור : tfds.image_classification.Imagenet2012Subset

  • גרסאות :

    • 2.0.0 : תקן תוויות אימות.
    • 2.0.1 : תיקון קידוד. אין שינויים מנקודת המבט של המשתמש.
    • 3.0.0 : תקן את הצבעוניות על ~12 תמונות (CMYK -> RGB). תקן פורמט לעקביות (המר את תמונת ה-png הבודדת ל-Jpeg). קריאה מהירה יותר מהדור ישירות מהארכיון.

    • 4.0.0 : (לא פורסם)

    • 5.0.0 (ברירת מחדל): API חדש מפוצל ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : נוסף פיצול בדיקה.

  • הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל download_config.manual_dir (ברירת המחדל היא ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir צריך להכיל שני קבצים: ILSVRC2012_img_train.tar ו-ILSVRC2012_img_val.tar. עליך להירשם ב- https://image-net.org/download-images כדי לקבל את הקישור להורדת מערך הנתונים.

  • שמור אוטומטי במטמון ( תיעוד ): לא

  • מבנה תכונה :

FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
שם קובץ טֶקסט tf.string
תמונה תמונה (אין, אין, 3) tf.uint8
תווית ClassLabel tf.int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (תצורת ברירת המחדל)

  • תיאור תצורה : 1pct מסך האימונים של ImageNet.

  • גודל הורדה : 254.22 KiB

  • גודל מערך נתונים : 7.61 GiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 12,811
'validation' 50,000

imagenet2012_subset/10pct

  • תיאור תצורה : 10% מסך האימונים של ImageNet.

  • גודל הורדה : 2.48 MiB

  • גודל ערכת נתונים: 19.91 GiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 128,116
'validation' 50,000