لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

الأشكال 3 د

3dshapes هي مجموعة بيانات من الأشكال ثلاثية الأبعاد تم إنشاؤها إجرائيًا من 6 عوامل كامنة مستقلة عن الحقيقة الأساسية. هذه العوامل هي لون الأرضية ولون الجدار ولون الكائن والمقياس والشكل والاتجاه .

جميع التركيبات الممكنة لهذه الكمون موجودة مرة واحدة بالضبط ، مما يؤدي إلى توليد N = 480000 صورة إجمالية.

قيم العامل الكامن

  • تدرج لون الأرضية: 10 قيم متباعدة خطيًا في [0 ، 1]
  • لون الجدار: 10 قيم متباعدة خطيًا في [0 ، 1]
  • لون الكائن: 10 قيم متباعدة خطيًا في [0 ، 1]
  • المقياس: 8 قيم متباعدة خطيًا في [0 ، 1]
  • الشكل: 4 قيم في [0 ، 1 ، 2 ، 3]
  • الاتجاه: 15 قيمة متباعدة خطيًا في [-30 ، 30]

قمنا بتغيير واحد كامن في كل مرة (بدءًا من الاتجاه ، ثم الشكل ، إلخ) ، وقمنا بتخزين الصور بترتيب ثابت في مجموعة images بالتتابع. يتم تخزين القيم المقابلة للعوامل بنفس الترتيب في صفيف labels .

انشق، مزق أمثلة
'train' 480،000
  • الميزات :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=tf.uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'value_floor_hue': tf.float32,
    'value_object_hue': tf.float32,
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_wall_hue': tf.float32,
})

التصور

  • الاقتباس :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}