- Açıklama :
Google RefExp veri kümesi, herkese açık MS-COCO veri kümesini temel alan, resimlerdeki nesnelerin metin açıklamalarından oluşan bir koleksiyondur. MS-COCO'daki görüntü başlıkları görüntünün tamamı için geçerliyken, bu veri kümesi, bir görüntü içindeki tek bir nesneyi veya bölgeyi benzersiz bir şekilde tanımlamaya olanak tanıyan metin açıklamalarına odaklanır. Bu belgede daha fazla ayrıntıya bakın: Belirsiz Nesne Açıklamalarının Oluşturulması ve Anlaşılması.
Ana sayfa : https://github.com/mjhucla/Google_Refexp_toolbox
Kaynak kodu :
tfds.vision_language.gref.Gref
Sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
Unknown size
Veri kümesi boyutu :
4.60 GiB
Manuel indirme talimatları : Bu veri kümesi, kaynak verileri download_config.manual_dir içine manuel olarak
download_config.manual_dir
gerektirir (varsayılanı~/tensorflow_datasets/downloads/manual/
):
Verileri COCO ile uyumlu biçimde indirmek ve önceden işlemek için https://github.com/mjhucla/Google_Refexp_toolbox adresindeki talimatları izleyin. Dizin 2 dosya ve bir klasör içerir:google_refexp_train_201511_coco_aligned_catg.json
google_refexp_val_201511_coco_aligned_catg.json
coco_train2014/
coco_train2014 klasörü, tüm COCO 2014 eğitim görüntülerini içerir.
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölmeler :
Bölmek | Örnekler |
---|---|
'train' | 24.698 |
'validation' | 4.650 |
- Özellikler :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=tf.uint8),
'image/id': tf.int64,
'objects': Sequence({
'area': tf.int64,
'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
'id': tf.int64,
'label': tf.int64,
'label_name': ClassLabel(shape=(), dtype=tf.int64, num_classes=80),
'refexp': Sequence({
'raw': Text(shape=(), dtype=tf.string),
'referent': Text(shape=(), dtype=tf.string),
'refexp_id': tf.int64,
'tokens': Sequence(Text(shape=(), dtype=tf.string)),
}),
}),
})
Denetimli anahtarlar (bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
- alıntı :
@inproceedings{mao2016generation,
title={Generation and Comprehension of Unambiguous Object Descriptions},
author={Mao, Junhua and Huang, Jonathan and Toshev, Alexander and Camburu, Oana and Yuille, Alan and Murphy, Kevin},
booktitle={CVPR},
year={2016}
}