ses

  • Açıklama :

Bu veri seti, Sınıflandırma ve Tespit yarışmalarına karşılık gelen PASCAL Görsel Nesne Sınıfları Mücadelesinden gelen verileri içerir.

Sınıflandırma yarışmasında amaç, görüntüde bulunan etiket kümesini tahmin etmek iken, Tespit yarışmasında amaç, her bir nesnenin sınırlayıcı kutusunu ve etiketini tahmin etmektir. UYARI: Resmi veri setine göre VOC2012 test seti açıklama içermemektedir.

  • Kaynak kodu : tfds.object_detection.Voc

  • Sürümler :

    • 4.0.0 (varsayılan): Sürüm notu yok.
  • Veri kümesi boyutu : Unknown size

  • Otomatik önbelleğe alındı ​​( belgeler ): Bilinmiyor

  • Özellik yapısı :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/filename': Text(shape=(), dtype=tf.string),
    'labels': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=20)),
    'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=20)),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'is_difficult': tf.bool,
        'is_truncated': tf.bool,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
        'pose': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
resim resim (Yok, Yok, 3) tf.uint8
resim/dosya adı Metin tf.string
etiketler Sıra(Sınıf Etiketi) (Hiçbiri,) tf.int64
labels_no_dificult Sıra(Sınıf Etiketi) (Hiçbiri,) tf.int64
nesneler Sekans
nesneler/bbox BBoxÖzelliği (4,) tf.float32
nesneler/zordur tensör tf.bool
nesneler/is_truncated tensör tf.bool
nesneler/etiket sınıf etiketi tf.int64
nesneler/poz sınıf etiketi tf.int64

voc/2007 (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Bu veri kümesi, VOC2007 olarak da bilinen PASCAL Görsel Nesne Sınıfları Mücadelesi 2007'den gelen verileri içerir.

Her görüntünün 20 farklı sınıftan bir dizi nesne içerdiği ve toplam 24640 açıklamalı nesne oluşturduğu bu veri kümesine toplam 9963 görüntü dahil edilmiştir.

Bölmek Örnekler
'test' 4.952
'train' 2.501
'validation' 2.510
  • alıntı :
@misc{pascal-voc-2007,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}

ses/2012

  • Yapılandırma açıklaması : Bu veri kümesi, VOC2012 olarak da bilinen PASCAL Görsel Nesne Sınıfları Mücadelesi 2012'den gelen verileri içerir.

Her görüntünün 20 farklı sınıftan bir dizi nesne içerdiği ve toplam 27450 açıklamalı nesne oluşturduğu bu veri kümesine toplam 11540 görüntü dahil edilmiştir.

Bölmek Örnekler
'test' 10.991
'train' 5.717
'validation' 5.823
  • alıntı :
@misc{pascal-voc-2012,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}