لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

gref

  • الوصف :

مجموعة بيانات Google RefExp عبارة عن مجموعة من الأوصاف النصية للكائنات في الصور والتي تعتمد على مجموعة بيانات MS-COCO المتاحة للجمهور. في حين أن التسميات التوضيحية للصورة في MS-COCO تنطبق على الصورة بأكملها ، تركز مجموعة البيانات هذه على أوصاف النص التي تسمح للشخص بتحديد كائن أو منطقة واحدة بشكل فريد داخل الصورة. اطلع على مزيد من التفاصيل في هذه الورقة: إنشاء وفهم أوصاف كائن لا لبس فيها.

  • الصفحة الرئيسية : https://github.com/mjhucla/Google_Refexp_toolbox

  • كود المصدر : tfds.vision_language.gref.Gref

  • إصدارات :

    • 1.0.0 (افتراضي): الإصدار الأولي.
  • حجم التنزيل : Unknown size

  • حجم مجموعة البيانات : 4.60 GiB

  • إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى download_config.manual_dir (الإعدادات الافتراضية على ~/tensorflow_datasets/downloads/manual/ ):
    اتبع التعليمات الموجودة على https://github.com/mjhucla/Google_Refexp_toolbox لتنزيل البيانات ومعالجتها مسبقًا بتنسيق متوافق مع COCO. يحتوي الدليل على ملفين ومجلد واحد:

  • google_refexp_train_201511_coco_aligned_catg.json

  • google_refexp_val_201511_coco_aligned_catg.json

  • coco_train2014 /

يحتوي مجلد coco_train2014 على جميع صور تدريب COCO 2014.

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • الانقسامات :

انشق، مزق أمثلة
'train' 24698
'validation' 4650
  • الميزات :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/id': tf.int64,
    'objects': Sequence({
        'area': tf.int64,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'id': tf.int64,
        'label': tf.int64,
        'label_name': ClassLabel(shape=(), dtype=tf.int64, num_classes=80),
        'refexp': Sequence({
            'raw': Text(shape=(), dtype=tf.string),
            'referent': Text(shape=(), dtype=tf.string),
            'refexp_id': tf.int64,
            'tokens': Sequence(Text(shape=(), dtype=tf.string)),
        }),
    }),
})

التصور

  • الاقتباس :
@inproceedings{mao2016generation,
  title={Generation and Comprehension of Unambiguous Object Descriptions},
  author={Mao, Junhua and Huang, Jonathan and Toshev, Alexander and Camburu, Oana and Yuille, Alan and Murphy, Kevin},
  booktitle={CVPR},
  year={2016}
}