ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

coco_captions

COCO คือชุดข้อมูลการตรวจจับ การแบ่งส่วน และคำอธิบายภาพขนาดใหญ่ เวอร์ชันนี้มีรูปภาพ ขอบเขต ป้ายกำกับ และคำบรรยายจาก COCO 2014 ซึ่งแบ่งออกเป็นส่วนย่อยที่กำหนดโดย Karpathy และ Li (2015) ซึ่งจะแบ่งข้อมูลการตรวจสอบความถูกต้องของ COCO 2014 เดิมออกเป็นชุดตรวจสอบและชุดทดสอบ 5,000 ภาพใหม่ บวกกับชุด "restval" ที่มีภาพที่เหลือประมาณ 30,000 ภาพ การแยกทั้งหมดมีคำอธิบายประกอบ

 • คำอธิบาย Config: รุ่นนี้มีภาพกล่องวิ่งและป้ายชื่อสำหรับรุ่น 2014

 • โฮมเพจ: http://cocodataset.org/#home

 • รหัสที่มา: tfds.object_detection.CocoCaptions

 • รุ่น:

  • 1.1.0 (เริ่มต้น): ไม่มีบันทึกประจำรุ่น
 • ขนาดการดาวน์โหลด: 37.61 GiB

 • ขนาดชุด: 18.83 GiB

 • ออโต้แคช ( เอกสาร ): ไม่มี

 • แยก:

แยก ตัวอย่าง
'restval' 30,504
'test' 5,000
'train' 82,783
'val' 5,000
 • คุณสมบัติ:
FeaturesDict({
  'captions': Sequence({
    'id': tf.int64,
    'text': tf.string,
  }),
  'image': Image(shape=(None, None, 3), dtype=tf.uint8),
  'image/filename': Text(shape=(), dtype=tf.string),
  'image/id': tf.int64,
  'objects': Sequence({
    'area': tf.int64,
    'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'id': tf.int64,
    'is_crowd': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=80),
  }),
})

การสร้างภาพ

 • อ้างอิง:
@article{DBLP:journals/corr/LinMBHPRDZ14,
 author  = {Tsung{-}Yi Lin and
        Michael Maire and
        Serge J. Belongie and
        Lubomir D. Bourdev and
        Ross B. Girshick and
        James Hays and
        Pietro Perona and
        Deva Ramanan and
        Piotr Doll{'{a} }r and
        C. Lawrence Zitnick},
 title   = {Microsoft {COCO:} Common Objects in Context},
 journal  = {CoRR},
 volume  = {abs/1405.0312},
 year   = {2014},
 url    = {http://arxiv.org/abs/1405.0312},
 archivePrefix = {arXiv},
 eprint  = {1405.0312},
 timestamp = {Mon, 13 Aug 2018 16:48:13 +0200},
 biburl  = {https://dblp.org/rec/bib/journals/corr/LinMBHPRDZ14},
 bibsource = {dblp computer science bibliography, https://dblp.org}
}@inproceedings{DBLP:conf/cvpr/KarpathyL15,
 author  = {Andrej Karpathy and
        Fei{-}Fei Li},
 title   = {Deep visual-semantic alignments for generating image
        descriptions},
 booktitle = { {IEEE} Conference on Computer Vision and Pattern Recognition,
        {CVPR} 2015, Boston, MA, USA, June 7-12, 2015},
 pages   = {3128--3137},
 publisher = { {IEEE} Computer Society},
 year   = {2015},
 url    = {https://doi.org/10.1109/CVPR.2015.7298932},
 doi    = {10.1109/CVPR.2015.7298932},
 timestamp = {Wed, 16 Oct 2019 14:14:50 +0200},
 biburl  = {https://dblp.org/rec/conf/cvpr/KarpathyL15.bib},
 bibsource = {dblp computer science bibliography, https://dblp.org}
}

coco_captions/2014 (การกำหนดค่าเริ่มต้น)