امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

گرف

  • توضیحات :

مجموعه داده های Google RefExp مجموعه ای از توصیف متن اشیا in در تصاویر است که بر اساس مجموعه داده های موجود در دسترس MS-COCO ساخته شده است. در حالی که زیرنویس های تصویر در MS-COCO برای کل تصویر صدق می کند ، این مجموعه داده بر توضیحات متنی متمرکز است که به فرد اجازه می دهد یک شی یا منطقه واحد را در یک تصویر شناسایی کند. جزئیات بیشتر را در این مقاله مشاهده کنید: تولید و درک توضیحات اشیاamb بدون ابهام.

  • صفحه اصلی : https://github.com/mjhucla/Google_Refexp_toolbox

  • کد منبع : tfds.vision_language.gref.Gref

  • نسخه ها :

    • 1.0.0 (پیش فرض): نسخه اولیه.
  • اندازه بارگیری : Unknown size

  • اندازه مجموعه داده : 4.60 GiB

  • دستورالعمل های بارگیری دستی : برای این مجموعه داده لازم است که داده های منبع را به صورت دستی در download_config.manual_dir (به طور پیش فرض ~/tensorflow_datasets/downloads/manual/ ):
    برای بارگیری و پیش پردازش داده ها در قالب تراز شده با COCO ، دستورالعمل های https://github.com/mjhucla/Google_Refexp_toolbox را دنبال کنید. فهرست شامل 2 پرونده و یک پوشه است:

  • google_refexp_train_201511_coco_aligned_catg.json

  • google_refexp_val_201511_coco_aligned_catg.json

  • coco_train2014 /

پوشه coco_train2014 شامل تمام تصاویر آموزش COCO 2014 است.

شکاف مثال ها
'train' 24،698
'validation' 4650
  • ویژگی ها :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/id': tf.int64,
    'objects': Sequence({
        'area': tf.int64,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'id': tf.int64,
        'label': tf.int64,
        'label_name': ClassLabel(shape=(), dtype=tf.int64, num_classes=80),
        'refexp': Sequence({
            'raw': Text(shape=(), dtype=tf.string),
            'referent': Text(shape=(), dtype=tf.string),
            'refexp_id': tf.int64,
            'tokens': Sequence(Text(shape=(), dtype=tf.string)),
        }),
    }),
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): None

  • نقل قول :

@inproceedings{mao2016generation,
  title={Generation and Comprehension of Unambiguous Object Descriptions},
  author={Mao, Junhua and Huang, Jonathan and Toshev, Alexander and Camburu, Oana and Yuille, Alan and Murphy, Kevin},
  booktitle={CVPR},
  year={2016}
}

تجسم