dsprite

dSprites adalah kumpulan data bentuk 2D yang dihasilkan secara prosedural dari 6 faktor laten independen ground truth. Faktor-faktor ini adalah warna , bentuk , skala , rotasi , posisi x dan y dari sprite.

Semua kemungkinan kombinasi dari laten ini hadir tepat satu kali, menghasilkan N = 737280 total gambar.

Nilai faktor laten

  • Warna putih
  • Bentuk: persegi, elips, hati
  • Skala: 6 nilai yang ditempatkan secara linear dalam [0,5, 1]
  • Orientasi: 40 nilai dalam [0, 2 pi]
  • Posisi X: 32 nilai dalam [0, 1]
  • Posisi Y: 32 nilai dalam [0, 1]

Kami memvariasikan laten satu per satu (mulai dari Posisi Y, lalu Posisi X, dll), dan secara berurutan menyimpan gambar dalam urutan tetap. Karenanya urutan sepanjang dimensi pertama adalah tetap dan memungkinkan Anda memetakan kembali ke nilai laten yang sesuai dengan gambar itu.

Kami sengaja memilih nilai laten untuk memiliki perubahan langkah terkecil sambil memastikan bahwa semua keluaran piksel berbeda. Tidak ada suara yang ditambahkan.

Membelah Contoh
'train' 737.280
  • Struktur fitur :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
gambar Gambar (64, 64, 1) uint8
label_orientasi LabelKelas int64
skala_label LabelKelas int64
label_shape LabelKelas int64
label_x_posisi LabelKelas int64
label_y_position LabelKelas int64
orientasi_nilai Tensor float32
skala_nilai Tensor float32
nilai_bentuk Tensor float32
nilai_x_posisi Tensor float32
nilai_y_posisi Tensor float32

Visualisasi

  • Kutipan :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}