Trực quan hóa : Khám phá khi biết dữ liệu của bạn
Mô tả :
dSprites là một bộ dữ liệu gồm các hình dạng 2D được tạo theo thủ tục từ 6 yếu tố tiềm ẩn độc lập với sự thật cơ bản. Các yếu tố này là màu sắc , hình dạng , tỷ lệ , xoay , vị trí x và y của một sprite.
Tất cả các kết hợp có thể có của các điểm tiềm ẩn này đều xuất hiện chính xác một lần, tạo ra tổng số N = 737280 hình ảnh.
Giá trị yếu tố tiềm ẩn
- Màu trắng
- Hình dạng: hình vuông, hình elip, trái tim
- Tỷ lệ: 6 giá trị được đặt cách đều nhau trong [0,5, 1]
- Định hướng: 40 giá trị trong [0, 2 pi]
- Vị trí X: 32 giá trị trong [0, 1]
- Vị trí Y: 32 giá trị trong [0, 1]
Chúng tôi thay đổi từng tiềm ẩn một (bắt đầu từ Vị trí Y, sau đó là Vị trí X, v.v.) và lưu trữ tuần tự các hình ảnh theo thứ tự cố định. Do đó, thứ tự dọc theo chiều đầu tiên được cố định và cho phép bạn ánh xạ trở lại giá trị của các tiềm ẩn tương ứng với hình ảnh đó.
Chúng tôi đã cố ý chọn các giá trị tiềm ẩn để có bước thay đổi nhỏ nhất trong khi vẫn đảm bảo rằng tất cả các đầu ra pixel đều khác nhau. Không có tiếng ồn đã được thêm vào.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://github.com/deepmind/dsprites-dataset
Mã nguồn :
tfds.datasets.dsprites.Builder
Phiên bản :
-
2.0.0
(mặc định): API phân tách mới ( https://tensorflow.org/datasets/splits ) -
2.1.0
: Không có ghi chú phát hành.
-
Kích thước tải xuống :
26.73 MiB
Kích thước tập dữ liệu :
Unknown size
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không xác định
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 737.280 |
- Cấu trúc tính năng :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
hình ảnh | Hình ảnh | (64, 64, 1) | uint8 | |
nhãn_orientation | LớpNhãn | int64 | ||
nhãn_scale | LớpNhãn | int64 | ||
nhãn_hình dạng | LớpNhãn | int64 | ||
nhãn_x_vị trí | LớpNhãn | int64 | ||
nhãn_y_vị trí | LớpNhãn | int64 | ||
value_orientation | tenxơ | phao32 | ||
value_scale | tenxơ | phao32 | ||
value_shape | tenxơ | phao32 | ||
giá trị_x_vị trí | tenxơ | phao32 | ||
giá_trị_y_vị_trí | tenxơ | phao32 |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}