- Deskripsi :
COCO adalah pendeteksian objek, segmentasi, dan kumpulan data teks berskala besar. Versi ini berisi gambar, kotak pembatas, label, dan teks dari COCO 2014, dibagi menjadi beberapa subset yang ditentukan oleh Karpathy dan Li (2015). Ini secara efektif membagi data validasi COCO 2014 asli menjadi validasi 5.000 gambar baru dan set pengujian, ditambah set "restval" yang berisi ~ 30 ribu gambar yang tersisa. Semua pemisahan memiliki anotasi teks.
Deskripsi konfigurasi : Versi ini berisi gambar, kotak pembatas, dan label untuk versi 2014.
Beranda : http://cocodataset.org/#home
Kode sumber :
tfds.object_detection.CocoCaptions
Versi :
-
1.1.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
37.61 GiB
Ukuran
18.83 GiB
data :18.83 GiB
Cache otomatis ( dokumentasi ): Tidak
Split :
Membagi | Contoh |
---|---|
'restval' | 30.504 |
'test' | 5.000 |
'train' | 82.783 |
'val' | 5.000 |
- Fitur :
FeaturesDict({
'captions': Sequence({
'id': tf.int64,
'text': tf.string,
}),
'image': Image(shape=(None, None, 3), dtype=tf.uint8),
'image/filename': Text(shape=(), dtype=tf.string),
'image/id': tf.int64,
'objects': Sequence({
'area': tf.int64,
'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
'id': tf.int64,
'is_crowd': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=80),
}),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Kutipan :
@article{DBLP:journals/corr/LinMBHPRDZ14,
author = {Tsung{-}Yi Lin and
Michael Maire and
Serge J. Belongie and
Lubomir D. Bourdev and
Ross B. Girshick and
James Hays and
Pietro Perona and
Deva Ramanan and
Piotr Doll{'{a} }r and
C. Lawrence Zitnick},
title = {Microsoft {COCO:} Common Objects in Context},
journal = {CoRR},
volume = {abs/1405.0312},
year = {2014},
url = {http://arxiv.org/abs/1405.0312},
archivePrefix = {arXiv},
eprint = {1405.0312},
timestamp = {Mon, 13 Aug 2018 16:48:13 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/LinMBHPRDZ14},
bibsource = {dblp computer science bibliography, https://dblp.org}
}@inproceedings{DBLP:conf/cvpr/KarpathyL15,
author = {Andrej Karpathy and
Fei{-}Fei Li},
title = {Deep visual-semantic alignments for generating image
descriptions},
booktitle = { {IEEE} Conference on Computer Vision and Pattern Recognition,
{CVPR} 2015, Boston, MA, USA, June 7-12, 2015},
pages = {3128--3137},
publisher = { {IEEE} Computer Society},
year = {2015},
url = {https://doi.org/10.1109/CVPR.2015.7298932},
doi = {10.1109/CVPR.2015.7298932},
timestamp = {Wed, 16 Oct 2019 14:14:50 +0200},
biburl = {https://dblp.org/rec/conf/cvpr/KarpathyL15.bib},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):