Visualisasi : Jelajahi di Kenali Data Anda
Deskripsi :
dSprites adalah kumpulan data bentuk 2D yang dihasilkan secara prosedural dari 6 faktor laten independen ground truth. Faktor-faktor ini adalah warna , bentuk , skala , rotasi , posisi x dan y dari sprite.
Semua kemungkinan kombinasi dari laten ini hadir tepat satu kali, menghasilkan N = 737280 total gambar.
Nilai faktor laten
- Warna putih
- Bentuk: persegi, elips, hati
- Skala: 6 nilai yang ditempatkan secara linear dalam [0,5, 1]
- Orientasi: 40 nilai dalam [0, 2 pi]
- Posisi X: 32 nilai dalam [0, 1]
- Posisi Y: 32 nilai dalam [0, 1]
Kami memvariasikan laten satu per satu (mulai dari Posisi Y, lalu Posisi X, dll), dan secara berurutan menyimpan gambar dalam urutan tetap. Karenanya urutan sepanjang dimensi pertama adalah tetap dan memungkinkan Anda memetakan kembali ke nilai laten yang sesuai dengan gambar itu.
Kami sengaja memilih nilai laten untuk memiliki perubahan langkah terkecil sambil memastikan bahwa semua keluaran piksel berbeda. Tidak ada suara yang ditambahkan.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Kode sumber :
tfds.datasets.dsprites.Builder
Versi :
-
2.0.0
(default): API split baru ( https://tensorflow.org/datasets/splits ) -
2.1.0
: Tidak ada catatan rilis.
-
Ukuran unduhan :
26.73 MiB
Ukuran set data :
Unknown size
Di-cache otomatis ( dokumentasi ): Tidak diketahui
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 737.280 |
- Struktur fitur :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
gambar | Gambar | (64, 64, 1) | uint8 | |
label_orientasi | LabelKelas | int64 | ||
skala_label | LabelKelas | int64 | ||
label_shape | LabelKelas | int64 | ||
label_x_posisi | LabelKelas | int64 | ||
label_y_position | LabelKelas | int64 | ||
orientasi_nilai | Tensor | float32 | ||
skala_nilai | Tensor | float32 | ||
nilai_bentuk | Tensor | float32 | ||
nilai_x_posisi | Tensor | float32 | ||
nilai_y_posisi | Tensor | float32 |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
- Kutipan :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}