akıllı

CLEVR, bir dizi görsel muhakeme yeteneğini test eden bir teşhis veri setidir. Minimum önyargı içerir ve her sorunun gerektirdiği muhakeme türünü açıklayan ayrıntılı açıklamalara sahiptir.

Bölmek örnekler
'test' 15.000
'train' 70.000
'validation' 15.000
  • Özellik yapısı :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        '3d_coords': Tensor(shape=(3,), dtype=float32),
        'color': ClassLabel(shape=(), dtype=int64, num_classes=8),
        'material': ClassLabel(shape=(), dtype=int64, num_classes=2),
        'pixel_coords': Tensor(shape=(3,), dtype=float32),
        'rotation': float32,
        'shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'size': ClassLabel(shape=(), dtype=int64, num_classes=2),
    }),
    'question_answer': Sequence({
        'answer': Text(shape=(), dtype=string),
        'question': Text(shape=(), dtype=string),
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
dosya adı Metin sicim
görüntü resim (Yok, Yok, 3) uint8
nesneler Sekans
nesneler/3d_coords tensör (3,) şamandıra32
nesneler/renk SınıfEtiketi int64
nesneler/malzeme SınıfEtiketi int64
nesneler/piksel_koordinasyonları tensör (3,) şamandıra32
nesneler/döndürme tensör şamandıra32
nesneler/şekil SınıfEtiketi int64
nesneler/boyut SınıfEtiketi int64
soru cevap Sekans
soru_cevap/cevap Metin sicim
soru_cevap/soru Metin sicim

görselleştirme

  • Alıntı :
@inproceedings{johnson2017clevr,
  title={ {CLEVR}: A diagnostic dataset for compositional language and elementary visual reasoning},
  author={Johnson, Justin and Hariharan, Bharath and van der Maaten, Laurens and Fei-Fei, Li and Lawrence Zitnick, C and Girshick, Ross},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  year={2017}
}