imagenet2012_subset

Imagenet2012 المجموعة الفرعية هي مجموعة فرعية من مجموعة بيانات ImageNet ILSVRC 2012 الأصلية. تشترك مجموعة البيانات في نفس مجموعة التحقق مثل مجموعة بيانات ImageNet ILSVRC 2012 الأصلية. ومع ذلك ، فإن مجموعة التدريب مقسمة إلى عينات فرعية بطريقة تسمية متوازنة. في تكوين 1pct ، أو 1٪ ، أو 12811 ، يتم أخذ عينات من الصور ، وتحتوي معظم الفئات على نفس عدد الصور (متوسط ​​12.8) ، وبعض الفئات تحتوي بشكل عشوائي على مثال واحد أكثر من غيرها ؛ وفي تكوين 10pct ، ~ 10٪ ، أو 128116 ، تحتوي معظم الفئات على نفس عدد الصور (متوسط ​​128) ، وبعض الفئات تحتوي بشكل عشوائي على مثال واحد أكثر من غيرها.

من المفترض أن يتم استخدام هذا كمعيار للتعلم شبه الخاضع للإشراف ، وقد تم استخدامه في الأصل في ورقة SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • الصفحة الرئيسية : http://image-net.org/

  • كود المصدر : tfds.datasets.imagenet2012_subset.Builder

  • إصدارات :

    • 2.0.0 : إصلاح بطاقات التحقق من الصحة.
    • 2.0.1 : إصلاح الترميز. لا توجد تغييرات من وجهة نظر المستخدم.
    • 3.0.0 : إصلاح التلوين على 12 صورة تقريبًا (CMYK -> RGB). تنسيق ثابت من أجل التناسق (تحويل صورة png المفردة إلى Jpeg). جيل أسرع قراءة مباشرة من الأرشيف.

    • 4.0.0 : (غير منشورة)

    • 5.0.0 (افتراضي): تقسيم API جديد ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : تمت إضافة تقسيم الاختبار.

  • إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى download_config.manual_dir (الإعدادات الافتراضية على ~/tensorflow_datasets/downloads/manual/ ):
    يجب أن يحتوي manual_dir على ملفين: ILSVRC2012_img_train.tar و ILSVRC2012_img_val.tar. تحتاج إلى التسجيل على https://image-net.org/download-images للحصول على الرابط لتنزيل مجموعة البيانات.

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • هيكل الميزة :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
اسم الملف نص سلسلة
صورة صورة (لا شيء ، لا شيء ، 3) uint8
ضع الكلمة المناسبة ClassLabel int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset / 1pct (التكوين الافتراضي)

  • وصف التكوين : 1pct من إجمالي مجموعة تدريب ImageNet.

  • حجم التحميل : 254.22 KiB

  • حجم مجموعة البيانات : 7.61 GiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 12،811
'validation' 50000

التصور

imagenet2012_subset / 10pct

  • وصف التكوين : 10pct من إجمالي مجموعة تدريب ImageNet.

  • حجم التحميل : 2.48 MiB

  • حجم مجموعة البيانات : 19.91 GiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 128116
'validation' 50000

التصور