- Deskripsi :
dSprites adalah kumpulan data bentuk 2D yang secara prosedural dihasilkan dari 6 faktor laten independen kebenaran dasar. Faktor-faktor tersebut adalah warna , bentuk , skala , rotasi , posisi x dan y dari sebuah sprite.
Semua kemungkinan kombinasi laten ini ada tepat satu kali, menghasilkan total N = 737280 gambar.
Nilai faktor laten
- Warna putih
- Bentuk: persegi, elips, hati
- Skala: 6 nilai berjarak linier dalam [0,5, 1]
- Orientasi: 40 nilai dalam [0, 2 pi]
- Posisi X: 32 nilai di [0, 1]
- Posisi Y: 32 nilai di [0, 1]
Kami memvariasikan satu laten pada satu waktu (mulai dari Posisi Y, lalu Posisi X, dll), dan secara berurutan menyimpan gambar dalam urutan yang tetap. Karenanya urutan sepanjang dimensi pertama ditetapkan dan memungkinkan Anda memetakan kembali ke nilai laten yang sesuai dengan gambar itu.
Kami sengaja memilih nilai laten agar memiliki perubahan langkah terkecil sambil memastikan bahwa semua keluaran piksel berbeda. Tidak ada suara yang ditambahkan.
Kode sumber :
tfds.image.Dsprites
Versi :
2.0.0
(default): API split baru ( https://tensorflow.org/datasets/splits )2.1.0
: Tidak ada catatan rilis.
Ukuran unduhan :
26.73 MiB
Ukuran kumpulan data :
Unknown size
Cache otomatis ( dokumentasi ): Tidak diketahui
Split :
Membagi | Contoh |
---|---|
'train' | 737.280 |
- Fitur :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
'value_orientation': tf.float32,
'value_scale': tf.float32,
'value_shape': tf.float32,
'value_x_position': tf.float32,
'value_y_position': tf.float32,
})
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Kutipan :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):