dsprites

dSprites เป็นชุดข้อมูลของรูปร่าง 2 มิติที่สร้างตามขั้นตอนจากปัจจัยแฝงที่เป็นอิสระจากความจริงพื้นฐาน 6 ประการ ปัจจัยเหล่านี้ ได้แก่ สี รูปร่าง สเกล การหมุน ตำแหน่ง x และ y ของสไปรต์

การรวมกันที่เป็นไปได้ทั้งหมดของแฝงเหล่านี้มีอยู่เพียงครั้งเดียว สร้างภาพทั้งหมด N = 737280 ภาพ

ค่าปัจจัยแฝง

  • สี: ขาว
  • รูปร่าง: สี่เหลี่ยม วงรี หัวใจ
  • มาตราส่วน: 6 ค่าที่เว้นระยะเชิงเส้นใน [0.5, 1]
  • การวางแนว: 40 ค่าใน [0, 2 pi]
  • ตำแหน่ง X: 32 ค่าใน [0, 1]
  • ตำแหน่ง Y: 32 ค่าใน [0, 1]

เราเปลี่ยนการแฝงแต่ละครั้ง (เริ่มจากตำแหน่ง Y จากนั้นตำแหน่ง X เป็นต้น) และจัดเก็บรูปภาพตามลำดับที่แน่นอนตามลำดับ ดังนั้น ลำดับตามมิติแรกจะได้รับการแก้ไข และอนุญาตให้คุณแมปกลับไปยังค่าของแฝงที่สอดคล้องกับรูปภาพนั้น

เราเลือกค่าแฝงโดยเจตนาเพื่อให้มีการเปลี่ยนแปลงขั้นตอนน้อยที่สุด ในขณะเดียวกันก็มั่นใจว่าเอาต์พุตพิกเซลทั้งหมดแตกต่างกัน ไม่มีการเพิ่มเสียงรบกวน

แยก ตัวอย่าง
'train' 737,280
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ภาพ ภาพ (64, 64, 1) uint8
label_orientation ป้ายกำกับคลาส int64
label_scale ป้ายกำกับคลาส int64
label_shape ป้ายกำกับคลาส int64
label_x_position ป้ายกำกับคลาส int64
label_y_position ป้ายกำกับคลาส int64
value_orientation เทนเซอร์ ลอย32
ค่า_ขนาด เทนเซอร์ ลอย32
ค่า_รูปร่าง เทนเซอร์ ลอย32
ค่า_x_ตำแหน่ง เทนเซอร์ ลอย32
ค่า_y_ตำแหน่ง เทนเซอร์ ลอย32

การสร้างภาพ

  • การอ้างอิง :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}