shapes3d

3dshapes مجموعه داده ای از اشکال سه بعدی است که به صورت رویه ای از 6 عامل نهفته مستقل از حقیقت پایه ایجاد می شود. این عوامل عبارتند از رنگ کف , رنگ دیوار , رنگ شی , مقیاس , شکل و جهت .

تمام ترکیبات ممکن از این پنهان‌ها دقیقاً یک بار وجود دارند و تعداد کل تصاویر N = 480000 را ایجاد می‌کنند.

مقادیر عامل پنهان

  • رنگ کف: 10 مقدار با فاصله خطی در [0، 1]
  • رنگ دیوار: 10 مقدار با فاصله خطی در [0، 1]
  • رنگ شی: 10 مقدار با فاصله خطی در [0، 1]
  • مقیاس: 8 مقدار با فاصله خطی در [0، 1]
  • شکل: 4 مقدار در [0، 1، 2، 3]
  • جهت: 15 مقدار با فاصله خطی در [30-, 30]

ما هر بار یک نهفته را تغییر دادیم (شروع از جهت گیری، سپس شکل و غیره)، و به ترتیب تصاویر را به ترتیب ثابت در آرایه images ذخیره کردیم. مقادیر متناظر فاکتورها به همان ترتیب در آرایه labels ذخیره می شوند.

شکاف مثال ها
'train' 480000
  • ساختار ویژگی :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تصویر تصویر (64، 64، 3) uint8
label_floor_hue ClassLabel int64
label_object_hue ClassLabel int64
label_orientation ClassLabel int64
label_scale ClassLabel int64
برچسب_شکل ClassLabel int64
label_wall_hue ClassLabel int64
value_floor_hue تانسور float32
value_object_hue تانسور float32
ارزش_گرا تانسور float32
ارزش_مقیاس تانسور float32
ارزش_شکل تانسور float32
value_wall_hue تانسور float32

تجسم

  • نقل قول :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}