- Açıklama:
Youtube-vis, bir video örneği segmentasyon veri setidir. 2.883 yüksek çözünürlüklü YouTube videosu, kişi, hayvanlar ve araçlar gibi 40 ortak nesneyi içeren piksel başına kategori etiketi seti, 4.883 benzersiz video örneği ve 131k yüksek kaliteli manuel açıklama içerir.
YouTube-VIS veri seti 2.238 eğitim videosuna, 302 doğrulama videosuna ve 343 test videosuna bölünmüştür.
Ön işleme sırasında hiçbir dosya kaldırılmadı veya değiştirilmedi.
Anasayfa: https://youtube-vos.org/dataset/vis/
Kaynak kodu:
tfds.video.youtube_vis.YoutubeVis
sürümleri:
-
1.0.0
(varsayılan): Başlangıç salım.
-
İndirme boyutu:
Unknown size
Manuel indirme talimatları: Bu veri kümesi içine elle kaynak verileri indirmenizi gerektirir
download_config.manual_dir
(varsayılan olarak~/tensorflow_datasets/downloads/manual/
):
Lütfen veri kümesinin 2019 sürümü için tüm dosyaları (test_all_frames.zip, test.json, train_all_frames.zip, train.json, valid_all_frames.zip, valid.json) youtube-vis web sitesinden indirin ve ~/tensorflow_datasets/ dizinine taşıyın. indirmeler/manuel/.
Not veri kümesi açılış sayfası yer aldığını https://youtube-vos.org/dataset/vis/, ve daha sonra bir sayfaya yönlendirir https://competitions.codalab.org Eğer 2019 sürümünü indirebilirsiniz veri kümesinden. Verileri indirmek için codalab'da bir hesap açmanız gerekecek. Bunu yazarken, codalab'a erişirken "Bağlantı güvenli değil" uyarısını atlamanız gerekeceğini unutmayın.
Otomatik önbelleğe ( dokümantasyon ): Hayır
Denetimli tuşları (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): desteklenmez.
Citation:
@article{DBLP:journals/corr/abs-1905-04804,
author = {Linjie Yang and
Yuchen Fan and
Ning Xu},
title = {Video Instance Segmentation},
journal = {CoRR},
volume = {abs/1905.04804},
year = {2019},
url = {http://arxiv.org/abs/1905.04804},
archivePrefix = {arXiv},
eprint = {1905.04804},
timestamp = {Tue, 28 May 2019 12:48:08 +0200},
biburl = {https://dblp.org/rec/journals/corr/abs-1905-04804.bib},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
youtube_vis/full (varsayılan yapılandırma)
Yapılandırma tanımı: veri kümesinin tam çözünürlükte versiyonu dahil etikete sahip olmayan kişiler de dahil olmak üzere tüm çerçeveler ile.
Veri kümesi boyutu:
33.31 GiB
Splits:
Bölmek | Örnekler |
---|---|
'test' | 343 |
'train' | 2.238 |
'validation' | 302 |
- Özellikler:
FeaturesDict({
'metadata': FeaturesDict({
'height': tf.int32,
'num_frames': tf.int32,
'video_name': tf.string,
'width': tf.int32,
}),
'tracks': Sequence({
'areas': Sequence(tf.float32),
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
'frames': Sequence(tf.int32),
'is_crowd': tf.bool,
'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
}),
'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})
- Örnekler ( tfds.as_dataframe ):
youtube_vis/480_640_full
Yapılandırma açıklaması: Bütün resimler bilinearly dahil tüm çerçevelerle 480 x 640 yeniden boyutlandırılır.
Veri kümesi boyutu:
130.02 GiB
Splits:
Bölmek | Örnekler |
---|---|
'test' | 343 |
'train' | 2.238 |
'validation' | 302 |
- Özellikler:
FeaturesDict({
'metadata': FeaturesDict({
'height': tf.int32,
'num_frames': tf.int32,
'video_name': tf.string,
'width': tf.int32,
}),
'tracks': Sequence({
'areas': Sequence(tf.float32),
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
'frames': Sequence(tf.int32),
'is_crowd': tf.bool,
'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
}),
'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})
- Örnekler ( tfds.as_dataframe ):
youtube_vis/480_640_only_frames_with_labels
Yapılandırma açıklaması: Bütün resimler bilinearly dahil etiketlerle sadece çerçeveli 480 x 640 yeniden boyutlandırılır.
Veri kümesi boyutu:
26.27 GiB
Splits:
Bölmek | Örnekler |
---|---|
'test' | 343 |
'train' | 2.238 |
'validation' | 302 |
- Özellikler:
FeaturesDict({
'metadata': FeaturesDict({
'height': tf.int32,
'num_frames': tf.int32,
'video_name': tf.string,
'width': tf.int32,
}),
'tracks': Sequence({
'areas': Sequence(tf.float32),
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
'frames': Sequence(tf.int32),
'is_crowd': tf.bool,
'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
}),
'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})
- Örnekler ( tfds.as_dataframe ):
youtube_vis/only_frames_with_labels
Yapılandırma açıklaması: kendi ana çözünürlükte dahil etiketlerle Sadece görüntüler.
Veri kümesi boyutu:
6.91 GiB
Splits:
Bölmek | Örnekler |
---|---|
'test' | 343 |
'train' | 2.238 |
'validation' | 302 |
- Özellikler:
FeaturesDict({
'metadata': FeaturesDict({
'height': tf.int32,
'num_frames': tf.int32,
'video_name': tf.string,
'width': tf.int32,
}),
'tracks': Sequence({
'areas': Sequence(tf.float32),
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
'frames': Sequence(tf.int32),
'is_crowd': tf.bool,
'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
}),
'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})
- Örnekler ( tfds.as_dataframe ):
youtube_vis/full_train_split
Yapılandırma tanımı: veri kümesinin tam çözünürlükte versiyonu dahil etikete sahip olmayan kişiler de dahil olmak üzere tüm çerçeveler ile. Değer ve test bölmeleri, eğitim verilerinden üretilir.
Veri kümesi boyutu:
26.09 GiB
Splits:
Bölmek | Örnekler |
---|---|
'test' | 200 |
'train' | 1.838 |
'validation' | 200 |
- Özellikler:
FeaturesDict({
'metadata': FeaturesDict({
'height': tf.int32,
'num_frames': tf.int32,
'video_name': tf.string,
'width': tf.int32,
}),
'tracks': Sequence({
'areas': Sequence(tf.float32),
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
'frames': Sequence(tf.int32),
'is_crowd': tf.bool,
'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
}),
'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})
- Örnekler ( tfds.as_dataframe ):
youtube_vis/480_640_full_train_split
Yapılandırma açıklaması: Bütün resimler bilinearly dahil tüm çerçevelerle 480 x 640 yeniden boyutlandırılır. Değer ve test bölmeleri, eğitim verilerinden üretilir.
Veri kümesi boyutu:
101.57 GiB
Splits:
Bölmek | Örnekler |
---|---|
'test' | 200 |
'train' | 1.838 |
'validation' | 200 |
- Özellikler:
FeaturesDict({
'metadata': FeaturesDict({
'height': tf.int32,
'num_frames': tf.int32,
'video_name': tf.string,
'width': tf.int32,
}),
'tracks': Sequence({
'areas': Sequence(tf.float32),
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
'frames': Sequence(tf.int32),
'is_crowd': tf.bool,
'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
}),
'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})
- Örnekler ( tfds.as_dataframe ):
youtube_vis/480_640_only_frames_with_labels_train_split
Yapılandırma açıklaması: Bütün resimler bilinearly dahil etiketlerle sadece çerçeveli 480 x 640 yeniden boyutlandırılır. Değer ve test bölmeleri, eğitim verilerinden üretilir.
Veri kümesi boyutu:
20.55 GiB
Splits:
Bölmek | Örnekler |
---|---|
'test' | 200 |
'train' | 1.838 |
'validation' | 200 |
- Özellikler:
FeaturesDict({
'metadata': FeaturesDict({
'height': tf.int32,
'num_frames': tf.int32,
'video_name': tf.string,
'width': tf.int32,
}),
'tracks': Sequence({
'areas': Sequence(tf.float32),
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
'frames': Sequence(tf.int32),
'is_crowd': tf.bool,
'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
}),
'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})
- Örnekler ( tfds.as_dataframe ):
youtube_vis/only_frames_with_labels_train_split
Yapılandırma açıklaması: kendi ana çözünürlükte dahil etiketlerle Sadece görüntüler. Değer ve test bölmeleri, eğitim verilerinden üretilir.
Veri kümesi boyutu:
5.46 GiB
Splits:
Bölmek | Örnekler |
---|---|
'test' | 200 |
'train' | 1.838 |
'validation' | 200 |
- Özellikler:
FeaturesDict({
'metadata': FeaturesDict({
'height': tf.int32,
'num_frames': tf.int32,
'video_name': tf.string,
'width': tf.int32,
}),
'tracks': Sequence({
'areas': Sequence(tf.float32),
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
'frames': Sequence(tf.int32),
'is_crowd': tf.bool,
'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
}),
'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})
- Örnekler ( tfds.as_dataframe ):