youtube_vis

  • Açıklama:

Youtube-vis, bir video örneği segmentasyon veri setidir. 2.883 yüksek çözünürlüklü YouTube videosu, kişi, hayvanlar ve araçlar gibi 40 ortak nesneyi içeren piksel başına kategori etiketi seti, 4.883 benzersiz video örneği ve 131k yüksek kaliteli manuel açıklama içerir.

YouTube-VIS veri seti 2.238 eğitim videosuna, 302 doğrulama videosuna ve 343 test videosuna bölünmüştür.

Ön işleme sırasında hiçbir dosya kaldırılmadı veya değiştirilmedi.

  • Anasayfa: https://youtube-vos.org/dataset/vis/

  • Kaynak kodu: tfds.video.youtube_vis.YoutubeVis

  • sürümleri:

    • 1.0.0 (varsayılan): Başlangıç salım.
  • İndirme boyutu: Unknown size

  • Manuel indirme talimatları: Bu veri kümesi içine elle kaynak verileri indirmenizi gerektirir download_config.manual_dir (varsayılan olarak ~/tensorflow_datasets/downloads/manual/ ):
    Lütfen veri kümesinin 2019 sürümü için tüm dosyaları (test_all_frames.zip, test.json, train_all_frames.zip, train.json, valid_all_frames.zip, valid.json) youtube-vis web sitesinden indirin ve ~/tensorflow_datasets/ dizinine taşıyın. indirmeler/manuel/.

Not veri kümesi açılış sayfası yer aldığını https://youtube-vos.org/dataset/vis/, ve daha sonra bir sayfaya yönlendirir https://competitions.codalab.org Eğer 2019 sürümünü indirebilirsiniz veri kümesinden. Verileri indirmek için codalab'da bir hesap açmanız gerekecek. Bunu yazarken, codalab'a erişirken "Bağlantı güvenli değil" uyarısını atlamanız gerekeceğini unutmayın.

@article{DBLP:journals/corr/abs-1905-04804,
  author    = {Linjie Yang and
               Yuchen Fan and
               Ning Xu},
  title     = {Video Instance Segmentation},
  journal   = {CoRR},
  volume    = {abs/1905.04804},
  year      = {2019},
  url       = {http://arxiv.org/abs/1905.04804},
  archivePrefix = {arXiv},
  eprint    = {1905.04804},
  timestamp = {Tue, 28 May 2019 12:48:08 +0200},
  biburl    = {https://dblp.org/rec/journals/corr/abs-1905-04804.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

youtube_vis/full (varsayılan yapılandırma)

  • Yapılandırma tanımı: veri kümesinin tam çözünürlükte versiyonu dahil etikete sahip olmayan kişiler de dahil olmak üzere tüm çerçeveler ile.

  • Veri kümesi boyutu: 33.31 GiB

  • Splits:

Bölmek Örnekler
'test' 343
'train' 2.238
'validation' 302
  • Özellikler:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})

youtube_vis/480_640_full

  • Yapılandırma açıklaması: Bütün resimler bilinearly dahil tüm çerçevelerle 480 x 640 yeniden boyutlandırılır.

  • Veri kümesi boyutu: 130.02 GiB

  • Splits:

Bölmek Örnekler
'test' 343
'train' 2.238
'validation' 302
  • Özellikler:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

youtube_vis/480_640_only_frames_with_labels

  • Yapılandırma açıklaması: Bütün resimler bilinearly dahil etiketlerle sadece çerçeveli 480 x 640 yeniden boyutlandırılır.

  • Veri kümesi boyutu: 26.27 GiB

  • Splits:

Bölmek Örnekler
'test' 343
'train' 2.238
'validation' 302
  • Özellikler:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

youtube_vis/only_frames_with_labels

  • Yapılandırma açıklaması: kendi ana çözünürlükte dahil etiketlerle Sadece görüntüler.

  • Veri kümesi boyutu: 6.91 GiB

  • Splits:

Bölmek Örnekler
'test' 343
'train' 2.238
'validation' 302
  • Özellikler:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})

youtube_vis/full_train_split

  • Yapılandırma tanımı: veri kümesinin tam çözünürlükte versiyonu dahil etikete sahip olmayan kişiler de dahil olmak üzere tüm çerçeveler ile. Değer ve test bölmeleri, eğitim verilerinden üretilir.

  • Veri kümesi boyutu: 26.09 GiB

  • Splits:

Bölmek Örnekler
'test' 200
'train' 1.838
'validation' 200
  • Özellikler:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})

youtube_vis/480_640_full_train_split

  • Yapılandırma açıklaması: Bütün resimler bilinearly dahil tüm çerçevelerle 480 x 640 yeniden boyutlandırılır. Değer ve test bölmeleri, eğitim verilerinden üretilir.

  • Veri kümesi boyutu: 101.57 GiB

  • Splits:

Bölmek Örnekler
'test' 200
'train' 1.838
'validation' 200
  • Özellikler:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

youtube_vis/480_640_only_frames_with_labels_train_split

  • Yapılandırma açıklaması: Bütün resimler bilinearly dahil etiketlerle sadece çerçeveli 480 x 640 yeniden boyutlandırılır. Değer ve test bölmeleri, eğitim verilerinden üretilir.

  • Veri kümesi boyutu: 20.55 GiB

  • Splits:

Bölmek Örnekler
'test' 200
'train' 1.838
'validation' 200
  • Özellikler:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

youtube_vis/only_frames_with_labels_train_split

  • Yapılandırma açıklaması: kendi ana çözünürlükte dahil etiketlerle Sadece görüntüler. Değer ve test bölmeleri, eğitim verilerinden üretilir.

  • Veri kümesi boyutu: 5.46 GiB

  • Splits:

Bölmek Örnekler
'test' 200
'train' 1.838
'validation' 200
  • Özellikler:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})