gref

  • Açıklama :

Google RefExp veri kümesi, herkese açık MS-COCO veri kümesini temel alan, resimlerdeki nesnelerin metin açıklamalarından oluşan bir koleksiyondur. MS-COCO'daki görüntü başlıkları görüntünün tamamı için geçerliyken, bu veri kümesi, bir görüntü içindeki tek bir nesneyi veya bölgeyi benzersiz bir şekilde tanımlamaya olanak tanıyan metin açıklamalarına odaklanır. Bu belgede daha fazla ayrıntıya bakın: Belirsiz Nesne Açıklamalarının Oluşturulması ve Anlaşılması.

  • Ana sayfa : https://github.com/mjhucla/Google_Refexp_toolbox

  • Kaynak kodu : tfds.vision_language.gref.Gref

  • Sürümler :

    • 1.0.0 (varsayılan): İlk sürüm.
  • İndirme boyutu : Unknown size

  • Veri kümesi boyutu : 4.60 GiB

  • Manuel indirme talimatları : Bu veri kümesi, kaynak verileri download_config.manual_dir içine manuel olarak download_config.manual_dir gerektirir (varsayılanı ~/tensorflow_datasets/downloads/manual/ ):
    Verileri COCO ile uyumlu biçimde indirmek ve önceden işlemek için https://github.com/mjhucla/Google_Refexp_toolbox adresindeki talimatları izleyin. Dizin 2 dosya ve bir klasör içerir:

  • google_refexp_train_201511_coco_aligned_catg.json

  • google_refexp_val_201511_coco_aligned_catg.json

  • coco_train2014/

coco_train2014 klasörü, tüm COCO 2014 eğitim görüntülerini içerir.

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölmeler :

Bölmek Örnekler
'train' 24.698
'validation' 4.650
  • Özellikler :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/id': tf.int64,
    'objects': Sequence({
        'area': tf.int64,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'id': tf.int64,
        'label': tf.int64,
        'label_name': ClassLabel(shape=(), dtype=tf.int64, num_classes=80),
        'refexp': Sequence({
            'raw': Text(shape=(), dtype=tf.string),
            'referent': Text(shape=(), dtype=tf.string),
            'refexp_id': tf.int64,
            'tokens': Sequence(Text(shape=(), dtype=tf.string)),
        }),
    }),
})

görselleştirme

  • alıntı :
@inproceedings{mao2016generation,
  title={Generation and Comprehension of Unambiguous Object Descriptions},
  author={Mao, Junhua and Huang, Jonathan and Toshev, Alexander and Camburu, Oana and Yuille, Alan and Murphy, Kevin},
  booktitle={CVPR},
  year={2016}
}