एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

चतुर

CLEVR एक डायग्नोस्टिक डेटासेट है जो कई तरह की विजुअल रीजनिंग क्षमताओं का परीक्षण करता है। इसमें न्यूनतम पूर्वाग्रह होते हैं और प्रत्येक प्रश्न के लिए आवश्यक तर्क के प्रकार का वर्णन करने वाले विस्तृत एनोटेशन होते हैं।

  • होमपेज: https://cs.stanford.edu/people/jcjohns/clevr/

  • स्रोत कोड: tfds.image.CLEVR

  • संस्करण:

    • 3.0.0 : नहीं रिलीज नोट्स।
    • 3.1.0 (डिफ़ॉल्ट): जोड़ें प्रश्न / उत्तर पाठ।
  • डाउनलोड का आकार: 17.72 GiB

  • डेटासेट का आकार: 17.75 GiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'test' 15,000
'train' ७०,०००
'validation' 15,000
  • विशेषताएं:
FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'objects': Sequence({
        '3d_coords': Tensor(shape=(3,), dtype=tf.float32),
        'color': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
        'material': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
        'pixel_coords': Tensor(shape=(3,), dtype=tf.float32),
        'rotation': tf.float32,
        'shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'size': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    }),
    'question_answer': Sequence({
        'answer': Text(shape=(), dtype=tf.string),
        'question': Text(shape=(), dtype=tf.string),
    }),
})

VISUALIZATION

  • प्रशस्ति पत्र:
@inproceedings{johnson2017clevr,
  title={ {CLEVR}: A diagnostic dataset for compositional language and elementary visual reasoning},
  author={Johnson, Justin and Hariharan, Bharath and van der Maaten, Laurens and Fei-Fei, Li and Lawrence Zitnick, C and Girshick, Ross},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  year={2017}
}