امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

coco_captions

  • توضیحات :

COCO یک مجموعه داده شناسایی ، تقسیم بندی و زیرنویس در مقیاس بزرگ است. این نسخه شامل تصاویر ، جعبه های محدود کننده ، برچسب ها و زیرنویس های COCO 2014 است که به زیر مجموعه های تعریف شده توسط Karpathy and Li (2015) تقسیم شده است. این داده های تأیید اعتبار اصلی COCO 2014 را به مجموعه های اعتبار سنجی و آزمایش 5000 تصویر جدید تقسیم می کند ، به علاوه یک مجموعه "restval" شامل تصاویر 30 باقیمانده باقیمانده. همه تقسیم ها حاوی حاشیه نویسی هستند.

  • توضیحات پیکربندی : این نسخه شامل تصاویر ، جعبه ها و برچسب های محدود کننده برای نسخه 2014 است.

  • صفحه اصلی : http://cocodataset.org/#home

  • کد منبع : tfds.object_detection.CocoCaptions

  • نسخه ها :

    • 1.1.0 (پیش فرض): بدون یادداشت انتشار.
  • اندازه بارگیری : 37.61 GiB

  • اندازه مجموعه داده : 18.83 GiB

  • ذخیره خودکار ( مستندات ): خیر

  • تقسیم :

شکاف مثال ها
'restval' 30،504
'test' 5000
'train' 82،783
'val' 5000
  • ویژگی ها :
FeaturesDict({
    'captions': Sequence({
        'id': tf.int64,
        'text': tf.string,
    }),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/filename': Text(shape=(), dtype=tf.string),
    'image/id': tf.int64,
    'objects': Sequence({
        'area': tf.int64,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'id': tf.int64,
        'is_crowd': tf.bool,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=80),
    }),
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): None

  • نقل قول :

@article{DBLP:journals/corr/LinMBHPRDZ14,
  author    = {Tsung{-}Yi Lin and
               Michael Maire and
               Serge J. Belongie and
               Lubomir D. Bourdev and
               Ross B. Girshick and
               James Hays and
               Pietro Perona and
               Deva Ramanan and
               Piotr Doll{'{a} }r and
               C. Lawrence Zitnick},
  title     = {Microsoft {COCO:} Common Objects in Context},
  journal   = {CoRR},
  volume    = {abs/1405.0312},
  year      = {2014},
  url       = {http://arxiv.org/abs/1405.0312},
  archivePrefix = {arXiv},
  eprint    = {1405.0312},
  timestamp = {Mon, 13 Aug 2018 16:48:13 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/LinMBHPRDZ14},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}@inproceedings{DBLP:conf/cvpr/KarpathyL15,
  author    = {Andrej Karpathy and
               Fei{-}Fei Li},
  title     = {Deep visual-semantic alignments for generating image
               descriptions},
  booktitle = { {IEEE} Conference on Computer Vision and Pattern Recognition,
               {CVPR} 2015, Boston, MA, USA, June 7-12, 2015},
  pages     = {3128--3137},
  publisher = { {IEEE} Computer Society},
  year      = {2015},
  url       = {https://doi.org/10.1109/CVPR.2015.7298932},
  doi       = {10.1109/CVPR.2015.7298932},
  timestamp = {Wed, 16 Oct 2019 14:14:50 +0200},
  biburl    = {https://dblp.org/rec/conf/cvpr/KarpathyL15.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

تجسم

coco_captions / 2014 (پیکربندی پیش فرض)