เอกนิสต์

ชุดข้อมูล EMNIST คือชุดตัวเลขอักขระที่เขียนด้วยลายมือซึ่งได้มาจาก NIST Special Database 19 และแปลงเป็นรูปแบบภาพ 28x28 พิกเซลและโครงสร้างชุดข้อมูลที่ตรงกับชุดข้อมูล MNIST โดยตรง

@article{cohen_afshar_tapson_schaik_2017,
    title={EMNIST: Extending MNIST to handwritten letters},
    DOI={10.1109/ijcnn.2017.7966217},
    journal={2017 International Joint Conference on Neural Networks (IJCNN)},
    author={Cohen, Gregory and Afshar, Saeed and Tapson, Jonathan and Schaik, Andre Van},
    year={2017}
}

emnist/byclass (การกำหนดค่าเริ่มต้น)

  • คำอธิบายการกำหนดค่า : EMNIST ByClass

  • ขนาดชุดข้อมูล : 349.16 MiB

  • แคชอัตโนมัติ ( เอกสาร ): No

  • แยก :

แยก ตัวอย่าง
'test' 116,323
'train' 697,932
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=62),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
ภาพ ภาพ (28, 28, 1) uint8
ฉลาก ClassLabel int64

emnist/bymerge

  • คำอธิบายการกำหนดค่า : EMNIST ByMerge

  • ขนาดชุดข้อมูล : 349.16 MiB

  • แคชอัตโนมัติ ( เอกสาร ): No

  • แยก :

แยก ตัวอย่าง
'test' 116,323
'train' 697,932
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=47),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
ภาพ ภาพ (28, 28, 1) uint8
ฉลาก ClassLabel int64

เอกนิสต์ / สมดุล

  • คำอธิบายการกำหนดค่า : EMNIST สมดุล

  • ขนาดชุดข้อมูล : 56.63 MiB

  • แคชอัตโนมัติ ( เอกสาร ): ใช่

  • แยก :

แยก ตัวอย่าง
'test' 18,800
'train' 112,800
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=47),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
ภาพ ภาพ (28, 28, 1) uint8
ฉลาก ClassLabel int64

เอกนิสต์/จดหมาย

  • คำอธิบายการกำหนดค่า : ตัวอักษร EMNIST

  • ขนาดชุดข้อมูล : 44.14 MiB

  • แคชอัตโนมัติ ( เอกสาร ): ใช่

  • แยก :

แยก ตัวอย่าง
'test' 14,800
'train' 88,800
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
ภาพ ภาพ (28, 28, 1) uint8
ฉลาก ClassLabel int64

เอกนิสต์/ตัวเลข

  • คำอธิบายการกำหนดค่า : EMNIST Digits

  • ขนาดชุดข้อมูล : 120.32 MiB

  • แคชอัตโนมัติ ( เอกสาร ): ใช่

  • แยก :

แยก ตัวอย่าง
'test' 40,000
'train' 240,000
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
ภาพ ภาพ (28, 28, 1) uint8
ฉลาก ClassLabel int64

เอกนิสต์/มินนิสต์

  • คำอธิบายการกำหนดค่า : EMNIST MNIST

  • ขนาดชุดข้อมูล : 30.09 MiB

  • แคชอัตโนมัติ ( เอกสาร ): ใช่

  • แยก :

แยก ตัวอย่าง
'test' 10,000
'train' 60,000
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
ภาพ ภาพ (28, 28, 1) uint8
ฉลาก ClassLabel int64