لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

coco_captions

COCO عبارة عن مجموعة بيانات واسعة النطاق لاكتشاف الكائنات وتقسيمها والتعليق عليها. يحتوي هذا الإصدار على صور ومربعات إحاطة وملصقات وتعليقات توضيحية من COCO 2014 مقسمة إلى مجموعات فرعية حددها Karpathy و Li (2015) هذا يقسم بشكل فعال بيانات التحقق من صحة COCO 2014 الأصلية إلى مجموعات جديدة للتحقق من صحة واختبار 5000 صورة ، بالإضافة إلى مجموعة "restval" التي تحتوي على الصور المتبقية ~ 30k. جميع الانقسامات لها تعليقات توضيحية.

  • وصف التكوين : يحتوي هذا الإصدار على صور ومربعات إحاطة وتسميات لإصدار 2014.

  • الصفحة الرئيسية : http://cocodataset.org/#home

  • كود المصدر : tfds.object_detection.CocoCaptions

  • إصدارات :

    • 1.1.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
  • حجم التحميل : 37.61 GiB

  • حجم مجموعة البيانات : 18.83 GiB

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • الانقسامات :

انشق، مزق أمثلة
'restval' 30504
'test' 5000
'train' 82،783
'val' 5000
  • الميزات :
FeaturesDict({
    'captions': Sequence({
        'id': tf.int64,
        'text': tf.string,
    }),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/filename': Text(shape=(), dtype=tf.string),
    'image/id': tf.int64,
    'objects': Sequence({
        'area': tf.int64,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'id': tf.int64,
        'is_crowd': tf.bool,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=80),
    }),
})

التصور

  • الاقتباس :
@article{DBLP:journals/corr/LinMBHPRDZ14,
  author    = {Tsung{-}Yi Lin and
               Michael Maire and
               Serge J. Belongie and
               Lubomir D. Bourdev and
               Ross B. Girshick and
               James Hays and
               Pietro Perona and
               Deva Ramanan and
               Piotr Doll{'{a} }r and
               C. Lawrence Zitnick},
  title     = {Microsoft {COCO:} Common Objects in Context},
  journal   = {CoRR},
  volume    = {abs/1405.0312},
  year      = {2014},
  url       = {http://arxiv.org/abs/1405.0312},
  archivePrefix = {arXiv},
  eprint    = {1405.0312},
  timestamp = {Mon, 13 Aug 2018 16:48:13 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/LinMBHPRDZ14},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}@inproceedings{DBLP:conf/cvpr/KarpathyL15,
  author    = {Andrej Karpathy and
               Fei{-}Fei Li},
  title     = {Deep visual-semantic alignments for generating image
               descriptions},
  booktitle = { {IEEE} Conference on Computer Vision and Pattern Recognition,
               {CVPR} 2015, Boston, MA, USA, June 7-12, 2015},
  pages     = {3128--3137},
  publisher = { {IEEE} Computer Society},
  year      = {2015},
  url       = {https://doi.org/10.1109/CVPR.2015.7298932},
  doi       = {10.1109/CVPR.2015.7298932},
  timestamp = {Wed, 16 Oct 2019 14:14:50 +0200},
  biburl    = {https://dblp.org/rec/conf/cvpr/KarpathyL15.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

coco_captions / 2014 (التكوين الافتراضي)