لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

كليفر

CLEVR هي مجموعة بيانات تشخيصية تختبر مجموعة من قدرات التفكير البصري. يحتوي على حد أدنى من التحيزات ويحتوي على شروح تفصيلية تصف نوع التفكير الذي يتطلبه كل سؤال.

  • الصفحة الرئيسية : https://cs.stanford.edu/people/jcjohns/clevr/

  • كود المصدر : tfds.image.CLEVR

  • إصدارات :

    • 3.0.0 : لا توجد ملاحظات الإصدار.
    • 3.1.0 (افتراضي): إضافة نص سؤال / إجابة.
  • حجم التحميل : 17.72 GiB

  • حجم مجموعة البيانات : 17.75 GiB

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • الانقسامات :

انشق، مزق أمثلة
'test' 15000
'train' 70000
'validation' 15000
  • الميزات :
FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'objects': Sequence({
        '3d_coords': Tensor(shape=(3,), dtype=tf.float32),
        'color': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
        'material': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
        'pixel_coords': Tensor(shape=(3,), dtype=tf.float32),
        'rotation': tf.float32,
        'shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'size': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    }),
    'question_answer': Sequence({
        'answer': Text(shape=(), dtype=tf.string),
        'question': Text(shape=(), dtype=tf.string),
    }),
})

التصور

  • الاقتباس :
@inproceedings{johnson2017clevr,
  title={ {CLEVR}: A diagnostic dataset for compositional language and elementary visual reasoning},
  author={Johnson, Justin and Hariharan, Bharath and van der Maaten, Laurens and Fei-Fei, Li and Lawrence Zitnick, C and Girshick, Ross},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  year={2017}
}