एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

आकार3डी

3dshapes 3D आकृतियों का एक डेटासेट है जो प्रक्रियात्मक रूप से 6 जमीनी सच्चाई स्वतंत्र अव्यक्त कारकों से उत्पन्न होता है। इन कारकों मंजिल रंग, दीवार का रंग, वस्तु रंग, पैमाना, आकार और अभिविन्यास है।

इन अव्यक्तों के सभी संभावित संयोजन ठीक एक बार मौजूद होते हैं, जिससे N = 480000 कुल चित्र बनते हैं।

गुप्त कारक मान

  • फ़्लोर ह्यू: १० मान रैखिक रूप से [०, १] में दूरी पर हैं
  • दीवार का रंग: १० मान रैखिक रूप से [०, १] में दूरी पर हैं
  • ऑब्जेक्ट ह्यू: १० मान रैखिक रूप से [०, १] में दूरी पर हैं
  • स्केल: 8 मान रैखिक रूप से [0, 1] में दूरी पर हैं
  • आकार: [0, 1, 2, 3] में 4 मान
  • अभिविन्यास: 15 मान रैखिक रूप से [-30, 30] में दूरी पर हैं

हम अलग-अलग एक समय में एक अव्यक्त (उन्मुखीकरण से शुरू है, तो आकार, आदि), और क्रमिक रूप से में तय क्रम में छवियों संग्रहीत images सरणी। कारकों में से संगत मानों में उसी क्रम में जमा हो जाती है labels सरणी।

विभाजित करना उदाहरण
'train' 480,000
  • विशेषताएं:
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=tf.uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'value_floor_hue': tf.float32,
    'value_object_hue': tf.float32,
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_wall_hue': tf.float32,
})

VISUALIZATION

  • प्रशस्ति पत्र:
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}