- Keterangan :
Dataset ini berisi data dari Tantangan Kelas Objek Visual PASCAL, terkait dengan kompetisi Klasifikasi dan Deteksi.
Pada kompetisi Klasifikasi tujuannya adalah untuk memprediksi kumpulan label yang terdapat pada gambar, sedangkan pada kompetisi Deteksi tujuannya adalah untuk memprediksi kotak pembatas dan label dari masing-masing objek. PERINGATAN: Sesuai dengan kumpulan data resmi, kumpulan pengujian VOC2012 tidak berisi anotasi.
Dokumentasi Tambahan : Jelajahi Makalah Dengan Kode
Kode sumber :
tfds.object_detection.Voc
Versi :
-
5.0.0
(default) : Tidak ada catatan rilis.
-
Cache otomatis ( dokumentasi ): Tidak
Struktur fitur :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_difficult': bool,
'is_truncated': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
gambar | Gambar | (Tidak ada, Tidak ada, 3) | uint8 | |
gambar/nama file | Teks | rangkaian | ||
label | Urutan (Label Kelas) | (Tidak ada,) | int64 | |
label_tidak_sulit | Urutan (Label Kelas) | (Tidak ada,) | int64 | |
objek | Urutan | |||
objek/bbox | Fitur BBox | (4,) | float32 | |
objek/adalah_sulit | Tensor | bodoh | ||
objek/dipotong | Tensor | bodoh | ||
benda/label | Label Kelas | int64 | ||
objek/pose | Label Kelas | int64 |
- Kunci yang diawasi (Lihat dokumen
as_supervised
):None
voc/2007 (konfigurasi default)
- Deskripsi konfigurasi : Dataset ini berisi data dari PASCAL Visual Object Classes Challenge 2007 alias VOC2007.
Sebanyak 9963 gambar dimasukkan dalam dataset ini, di mana setiap gambar berisi sekumpulan objek, dari 20 kelas berbeda, sehingga total ada 24640 objek beranotasi.
Ukuran unduhan :
868.85 MiB
Ukuran kumpulan data :
837.73 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 4.952 |
'train' | 2.501 |
'validation' | 2.510 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
- Kutipan :
@misc{pascal-voc-2007,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}
voc/2012
- Deskripsi konfigurasi : Dataset ini berisi data dari PASCAL Visual Object Classes Challenge 2012 alias VOC2012.
Sebanyak 11540 gambar dimasukkan dalam dataset ini, di mana setiap gambar berisi sekumpulan objek, dari 20 kelas berbeda, sehingga total ada 27450 objek beranotasi.
Ukuran unduhan :
3.59 GiB
Ukuran kumpulan data :
2.44 GiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 10.991 |
'train' | 5.717 |
'validation' | 5.823 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
- Kutipan :
@misc{pascal-voc-2012,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}