Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

dsprites

  • Deskripsi :

dSprites adalah kumpulan data bentuk 2D yang secara prosedural dihasilkan dari 6 faktor laten independen kebenaran dasar. Faktor-faktor tersebut adalah warna , bentuk , skala , rotasi , posisi x dan y dari sebuah sprite.

Semua kemungkinan kombinasi laten ini ada tepat satu kali, menghasilkan total N = 737280 gambar.

Nilai faktor laten

  • Warna putih
  • Bentuk: persegi, elips, hati
  • Skala: 6 nilai berjarak linier dalam [0,5, 1]
  • Orientasi: 40 nilai dalam [0, 2 pi]
  • Posisi X: 32 nilai di [0, 1]
  • Posisi Y: 32 nilai di [0, 1]

Kami memvariasikan satu laten pada satu waktu (mulai dari Posisi Y, lalu Posisi X, dll), dan secara berurutan menyimpan gambar dalam urutan yang tetap. Karenanya urutan sepanjang dimensi pertama ditetapkan dan memungkinkan Anda memetakan kembali ke nilai laten yang sesuai dengan gambar itu.

Kami sengaja memilih nilai laten agar memiliki perubahan langkah terkecil sambil memastikan bahwa semua keluaran piksel berbeda. Tidak ada suara yang ditambahkan.

Membagi Contoh
'train' 737.280
  • Fitur :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_x_position': tf.float32,
    'value_y_position': tf.float32,
})
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}

Visualisasi