эмнист

Набор данных EMNIST представляет собой набор рукописных цифр, полученных из специальной базы данных NIST 19 и преобразованных в формат изображения 28x28 пикселей и структуру набора данных, которая напрямую соответствует набору данных MNIST.

@article{cohen_afshar_tapson_schaik_2017,
    title={EMNIST: Extending MNIST to handwritten letters},
    DOI={10.1109/ijcnn.2017.7966217},
    journal={2017 International Joint Conference on Neural Networks (IJCNN)},
    author={Cohen, Gregory and Afshar, Saeed and Tapson, Jonathan and Schaik, Andre Van},
    year={2017}
}

emnist/byclass (конфигурация по умолчанию)

  • Описание конфигурации : EMNIST ByClass

  • Размер набора данных : 349.16 MiB

  • Автокэширование ( документация ): Нет

  • Расколы :

Расколоть Примеры
'test' 116 323
'train' 697 932
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=62),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
изображение Изображение (28, 28, 1) uint8
этикетка Класслейбл int64

Визуализация

эмнист / слияние

  • Описание конфигурации : EMNIST ByMerge

  • Размер набора данных : 349.16 MiB

  • Автокэширование ( документация ): Нет

  • Расколы :

Расколоть Примеры
'test' 116 323
'train' 697 932
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=47),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
изображение Изображение (28, 28, 1) uint8
этикетка Класслейбл int64

Визуализация

эмнист/сбалансированный

  • Описание конфигурации : EMNIST Balanced

  • Размер набора данных : 56.63 MiB

  • Автокэширование ( документация ): Да

  • Расколы :

Расколоть Примеры
'test' 18 800
'train' 112 800
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=47),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
изображение Изображение (28, 28, 1) uint8
этикетка Класслейбл int64

Визуализация

эмнист/письма

  • Описание конфигурации : Буквы EMNIST

  • Размер набора данных : 44.14 MiB

  • Автокэширование ( документация ): Да

  • Расколы :

Расколоть Примеры
'test' 14 800
'train' 88 800
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
изображение Изображение (28, 28, 1) uint8
этикетка Класслейбл int64

Визуализация

эмнист/цифры

  • Описание конфигурации : EMNIST Digits

  • Размер набора данных : 120.32 MiB

  • Автокэширование ( документация ): Да

  • Расколы :

Расколоть Примеры
'test' 40 000
'train' 240 000
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
изображение Изображение (28, 28, 1) uint8
этикетка Класслейбл int64

Визуализация

эмнист/мнист

  • Описание конфигурации : EMNIST MNIST

  • Размер набора данных : 30.09 MiB

  • Автокэширование ( документация ): Да

  • Расколы :

Расколоть Примеры
'test' 10 000
'train' 60 000
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
изображение Изображение (28, 28, 1) uint8
этикетка Класслейбл int64

Визуализация