امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

coco_captions

 • توضیحات :

COCO یک مجموعه داده شناسایی ، تقسیم بندی و زیرنویس در مقیاس بزرگ است. این نسخه شامل تصاویر ، جعبه های محدود کننده ، برچسب ها و زیرنویس های COCO 2014 است که به زیر مجموعه های تعریف شده توسط Karpathy and Li (2015) تقسیم شده است. این داده های تأیید اعتبار اصلی COCO 2014 را به مجموعه های اعتبار سنجی و آزمایش 5000 تصویر جدید تقسیم می کند ، به علاوه یک مجموعه "restval" شامل تصاویر 30 باقیمانده باقیمانده. همه تقسیم ها حاوی حاشیه نویسی هستند.

 • توضیحات پیکربندی : این نسخه شامل تصاویر ، جعبه ها و برچسب های محدود کننده برای نسخه 2014 است.

 • صفحه اصلی : http://cocodataset.org/#home

 • کد منبع : tfds.object_detection.CocoCaptions

 • نسخه ها :

  • 1.1.0 (پیش فرض): بدون یادداشت انتشار.
 • اندازه بارگیری : 37.61 GiB

 • اندازه مجموعه داده : 18.83 GiB

 • ذخیره خودکار ( مستندات ): خیر

 • تقسیم :

شکاف مثال ها
'restval' 30،504
'test' 5000
'train' 82،783
'val' 5000
 • ویژگی ها :
FeaturesDict({
  'captions': Sequence({
    'id': tf.int64,
    'text': tf.string,
  }),
  'image': Image(shape=(None, None, 3), dtype=tf.uint8),
  'image/filename': Text(shape=(), dtype=tf.string),
  'image/id': tf.int64,
  'objects': Sequence({
    'area': tf.int64,
    'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'id': tf.int64,
    'is_crowd': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=80),
  }),
})
 • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): None

 • نقل قول :

@article{DBLP:journals/corr/LinMBHPRDZ14,
 author  = {Tsung{-}Yi Lin and
        Michael Maire and
        Serge J. Belongie and
        Lubomir D. Bourdev and
        Ross B. Girshick and
        James Hays and
        Pietro Perona and
        Deva Ramanan and
        Piotr Doll{'{a} }r and
        C. Lawrence Zitnick},
 title   = {Microsoft {COCO:} Common Objects in Context},
 journal  = {CoRR},
 volume  = {abs/1405.0312},
 year   = {2014},
 url    = {http://arxiv.org/abs/1405.0312},
 archivePrefix = {arXiv},
 eprint  = {1405.0312},
 timestamp = {Mon, 13 Aug 2018 16:48:13 +0200},
 biburl  = {https://dblp.org/rec/bib/journals/corr/LinMBHPRDZ14},
 bibsource = {dblp computer science bibliography, https://dblp.org}
}@inproceedings{DBLP:conf/cvpr/KarpathyL15,
 author  = {Andrej Karpathy and
        Fei{-}Fei Li},
 title   = {Deep visual-semantic alignments for generating image
        descriptions},
 booktitle = { {IEEE} Conference on Computer Vision and Pattern Recognition,
        {CVPR} 2015, Boston, MA, USA, June 7-12, 2015},
 pages   = {3128--3137},
 publisher = { {IEEE} Computer Society},
 year   = {2015},
 url    = {https://doi.org/10.1109/CVPR.2015.7298932},
 doi    = {10.1109/CVPR.2015.7298932},
 timestamp = {Wed, 16 Oct 2019 14:14:50 +0200},
 biburl  = {https://dblp.org/rec/conf/cvpr/KarpathyL15.bib},
 bibsource = {dblp computer science bibliography, https://dblp.org}
}

تجسم

coco_captions / 2014 (پیکربندی پیش فرض)