لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

دسبريتس

dSprites هي مجموعة بيانات من الأشكال ثنائية الأبعاد تم إنشاؤها إجرائيًا من 6 عوامل كامنة مستقلة عن الحقيقة الأساسية. هذه العوامل هي اللون والشكل والمقياس والدوران ومواضع x و y للكائن.

جميع التركيبات الممكنة لهذه الكمون موجودة مرة واحدة بالضبط ، مما يؤدي إلى توليد N = 737280 صورة إجمالية.

قيم العامل الكامن

  • اللون الابيض
  • الشكل: مربع ، القطع الناقص ، القلب
  • المقياس: 6 قيم متباعدة خطيًا في [0.5 ، 1]
  • الاتجاه: 40 قيمة في [0 ، 2 بي]
  • الموضع X: 32 قيمة في [0 ، 1]
  • الموضع ص: 32 قيمة في [0 ، 1]

قمنا بتغيير واحد كامن في كل مرة (بدءًا من الموضع Y ، ثم الموضع X ، إلخ) ، وقمنا بتخزين الصور بترتيب ثابت. ومن ثم يكون الترتيب على طول البعد الأول ثابتًا ويسمح لك بالرجوع إلى قيمة العناصر الكامنة المقابلة لتلك الصورة.

لقد اخترنا قيم الكامنة عن عمد لإجراء تغييرات أصغر في الخطوات مع ضمان اختلاف جميع مخرجات البكسل. لم تتم إضافة ضجيج.

انشق، مزق أمثلة
'train' 737280
  • الميزات :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_x_position': tf.float32,
    'value_y_position': tf.float32,
})

التصور

  • الاقتباس :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}