एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

जी आर ई एफ

  • विवरण:

Google RefExp डेटासेट छवियों में वस्तुओं के टेक्स्ट विवरण का एक संग्रह है जो सार्वजनिक रूप से उपलब्ध MS-COCO डेटासेट पर बनता है। जबकि MS-COCO में छवि कैप्शन पूरी छवि पर लागू होते हैं, यह डेटासेट टेक्स्ट विवरणों पर केंद्रित होता है जो किसी छवि के भीतर किसी एक वस्तु या क्षेत्र को विशिष्ट रूप से पहचानने की अनुमति देता है। इस पेपर में अधिक विवरण देखें: स्पष्ट वस्तु विवरण की उत्पत्ति और समझ।

  • होमपेज: https://github.com/mjhucla/Google_Refexp_toolbox

  • स्रोत कोड: tfds.vision_language.gref.Gref

  • संस्करण:

    • 1.0.0 (डिफ़ॉल्ट): प्रारंभिक रिलीज़।
  • डाउनलोड का आकार: Unknown size

  • डेटासेट का आकार: 4.60 GiB

  • मैनुअल डाउनलोड के निर्देश: यह डेटासेट आप में मैन्युअल रूप से स्रोत डेटा डाउनलोड करने के लिए की आवश्यकता है download_config.manual_dir (करने के लिए डिफ़ॉल्ट ~/tensorflow_datasets/downloads/manual/ ):
    पर निर्देशों का पालन करें https://github.com/mjhucla/Google_Refexp_toolbox डाउनलोड करने और कोको के साथ गठबंधन किया प्रारूप में डेटा पूर्व की प्रक्रिया। निर्देशिका में 2 फ़ाइलें और एक फ़ोल्डर है:

  • google_refexp_train_201511_coco_aligned_catg.json

  • google_refexp_val_201511_coco_aligned_catg.json

  • कोको_ट्रेन2014/

Coco_train2014 फ़ोल्डर में COCO 2014 के सभी प्रशिक्षण चित्र हैं।

विभाजित करना उदाहरण
'train' 24,698
'validation' 4,650
  • विशेषताएं:
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/id': tf.int64,
    'objects': Sequence({
        'area': tf.int64,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'id': tf.int64,
        'label': tf.int64,
        'label_name': ClassLabel(shape=(), dtype=tf.int64, num_classes=80),
        'refexp': Sequence({
            'raw': Text(shape=(), dtype=tf.string),
            'referent': Text(shape=(), dtype=tf.string),
            'refexp_id': tf.int64,
            'tokens': Sequence(Text(shape=(), dtype=tf.string)),
        }),
    }),
})

VISUALIZATION

  • प्रशस्ति पत्र:
@inproceedings{mao2016generation,
  title={Generation and Comprehension of Unambiguous Object Descriptions},
  author={Mao, Junhua and Huang, Jonathan and Toshev, Alexander and Camburu, Oana and Yuille, Alan and Murphy, Kevin},
  booktitle={CVPR},
  year={2016}
}