سيفار 10_1

مجموعة بيانات CIFAR-10.1 هي مجموعة اختبار جديدة لـ CIFAR-10. يحتوي CIFAR-10.1 على ما يقرب من 2000 صورة اختبار جديدة تم أخذ عينات منها بعد عدة سنوات من البحث على مجموعة بيانات CIFAR-10 الأصلية. تم تصميم جمع البيانات لـ CIFAR-10.1 لتقليل تحول التوزيع بالنسبة لمجموعة البيانات الأصلية. وصفنا إنشاء CIFAR-10.1 في الورقة "هل يتم تعميم CIFAR-10 Classifiers على CIFAR-10؟". الصور في CIFAR-10.1 هي مجموعة فرعية من مجموعة بيانات TinyImages. يوجد حاليًا إصداران من مجموعة بيانات CIFAR-10.1: v4 و v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صورة صورة (32 ، 32 ، 3) uint8
ضع الكلمة المناسبة ClassLabel int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1 / v4 (التكوين الافتراضي)

  • وصف التكوين : هذا هو الإصدار الأول من مجموعة البيانات التي قمنا باختبار أي مصنف عليها. كما ذكرنا أعلاه ، فإن هذا يجعل مجموعة البيانات v4 مستقلة عن المصنفات التي نقوم بتقييمها. تستخدم الأرقام الواردة في الأقسام الرئيسية من ورقتنا هذا الإصدار من مجموعة البيانات. تم إنشاؤه من أفضل 25 كلمة مفتاحية لـ TinyImages لكل فئة ، مما أدى إلى اختلال بسيط في الفئة. الاختلاف الأكبر هو أن السفن تشكل 8٪ فقط من مجموعة الاختبار بدلاً من 10٪. يحتوي الإصدار 4 على 2021 صورة.

  • حجم التحميل : 5.93 MiB

  • حجم مجموعة البيانات : 4.46 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 2،021

التصور

سيفار 10_1 / v6

  • وصف التكوين : مشتق من تخصيص الكلمات الرئيسية المحسّن قليلاً والذي يكون متوازناً تماماً في الفئة. يتوافق هذا الإصدار من مجموعة البيانات مع النتائج الواردة في الملحق د من ورقتنا البحثية. الإصدار 6 يحتوي على 2000 صورة.

  • حجم التحميل : 5.87 MiB

  • حجم مجموعة البيانات : 4.40 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 2000

التصور