Эта страница была переведа с помощью Cloud Translation API.
Switch to English

cifar10_1

  • Описание :

Набор данных CIFAR-10.1 - это новый набор тестов для CIFAR-10. CIFAR-10.1 содержит примерно 2000 новых тестовых изображений, которые были взяты после нескольких лет исследований исходного набора данных CIFAR-10. Сбор данных для CIFAR-10.1 был разработан, чтобы минимизировать сдвиг распределения относительно исходного набора данных. Мы описываем создание CIFAR-10.1 в статье «Обобщаются ли классификаторы CIFAR-10 на CIFAR-10?». Изображения в CIFAR-10.1 являются подмножеством набора данных TinyImages. В настоящее время существует две версии набора данных CIFAR-10.1: v4 и v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • Контролируемые ключи (см. as_supervised ): ('image', 'label')

  • Цитата :

@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1 / v4 (конфигурация по умолчанию)

  • Описание конфигурации : это первая версия нашего набора данных, на которой мы тестировали любой классификатор. Как упоминалось выше, это делает набор данных v4 независимым от оцениваемых нами классификаторов. Цифры, приведенные в основных разделах нашей статьи, используют эту версию набора данных. Он был построен из 25 основных ключевых слов TinyImages для каждого класса, что привело к небольшому дисбалансу классов. Самая большая разница в том, что корабли составляют только 8% тестовой выборки вместо 10%. v4 содержит 2021 изображение.

  • Размер загрузки : 5.93 MiB

  • Размер набора данных : 4.46 MiB

  • Сплит :

Трещина Примеры
'test' 2 021

Визуализация

cifar10_1 / v6

  • Описание конфигурации : оно получено из слегка улучшенного распределения ключевых слов, которое точно сбалансировано по классам. Эта версия набора данных соответствует результатам в Приложении D нашей статьи. v6 содержит 2000 изображений.

  • Размер загрузки : 5.87 MiB

  • Размер набора данных : 4.40 MiB

  • Сплит :

Трещина Примеры
'test' 2 000

Визуализация