emnist

EMNISTデータセットは、NIST Special Database 19から派生し、MNISTデータセットと直接一致する28x28ピクセルの画像形式とデータセット構造に変換された手書き文字の数字のセットです。

@article{cohen_afshar_tapson_schaik_2017,
    title={EMNIST: Extending MNIST to handwritten letters},
    DOI={10.1109/ijcnn.2017.7966217},
    journal={2017 International Joint Conference on Neural Networks (IJCNN)},
    author={Cohen, Gregory and Afshar, Saeed and Tapson, Jonathan and Schaik, Andre Van},
    year={2017}
}

emnist / byclass(デフォルト設定)

  • コンフィグの説明:EMNIST ByClass

  • スプリット

スプリット
'test' 116,323
'train' 697,932
  • 特長
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=62),
})

視覚化

emnist / bymerge

  • コンフィグの説明:EMNIST ByMerge

  • スプリット

スプリット
'test' 116,323
'train' 697,932
  • 特長
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=47),
})

視覚化

エムニスト/バランス

  • コンフィグの説明:EMNISTがバランス

  • スプリット

スプリット
'test' 18,800
'train' 112,800
  • 特長
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=47),
})

視覚化

emnist / letters

  • コンフィグの説明:EMNIST手紙

  • スプリット

スプリット
'test' 14,800
'train' 88,800
  • 特長
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=37),
})

視覚化

emnist / Digits

  • コンフィグの説明:EMNIST数字

  • スプリット

スプリット
'test' 40,000
'train' 240,000
  • 特長
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})

視覚化

emnist / mnist

  • コンフィグの説明:EMNIST MNIST

  • スプリット

スプリット
'test' 10,000
'train' 60,000
  • 特長
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})

視覚化