एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

youtube_vis

  • विवरण:

Youtube-vis एक वीडियो इंस्टेंस सेगमेंटेशन डेटासेट है। इसमें 2,883 उच्च-रिज़ॉल्यूशन वाले YouTube वीडियो, एक प्रति-पिक्सेल श्रेणी का लेबल सेट शामिल है, जिसमें 40 सामान्य वस्तुएं जैसे व्यक्ति, जानवर और वाहन, 4,883 अद्वितीय वीडियो इंस्टेंस और 131k उच्च-गुणवत्ता वाले मैनुअल एनोटेशन शामिल हैं।

YouTube-VIS डेटासेट को 2,238 प्रशिक्षण वीडियो, 302 सत्यापन वीडियो और 343 परीक्षण वीडियो में विभाजित किया गया है।

प्रीप्रोसेसिंग के दौरान किसी भी फाइल को हटाया या बदला नहीं गया था।

  • होमपेज: https://youtube-vos.org/dataset/vis/

  • स्रोत कोड: tfds.video.youtube_vis.YoutubeVis

  • संस्करण:

    • 1.0.0 (डिफ़ॉल्ट): प्रारंभिक रिलीज़।
  • डाउनलोड का आकार: Unknown size

  • मैनुअल डाउनलोड के निर्देश: यह डेटासेट आप में मैन्युअल रूप से स्रोत डेटा डाउनलोड करने के लिए की आवश्यकता है download_config.manual_dir (करने के लिए डिफ़ॉल्ट ~/tensorflow_datasets/downloads/manual/ ):
    कृपया यूट्यूब-विज़ वेबसाइट से डेटासेट के 2019 संस्करण (test_all_frames.zip, test.json, train_all_frames.zip, train.json,Valid_all_frames.zip,Valid.json) के लिए सभी फाइलें डाउनलोड करें और उन्हें ~/tensorflow_datasets/ पर ले जाएं। डाउनलोड/मैनुअल/.

ध्यान दें कि डाटासेट लैंडिंग पृष्ठ पर स्थित है https://youtube-vos.org/dataset/vis/, और यह तब पर एक पृष्ठ पर रीडायरेक्ट करेगा https://competitions.codalab.org आप 2019 संस्करण डाउनलोड कर सकते हैं जहां डेटासेट का। डेटा डाउनलोड करने के लिए आपको कोडलैब पर अकाउंट बनाना होगा। ध्यान दें कि इसे लिखते समय, आपको कोडलैब का उपयोग करते समय "कनेक्शन सुरक्षित नहीं है" चेतावनी को बायपास करना होगा।

@article{DBLP:journals/corr/abs-1905-04804,
  author    = {Linjie Yang and
               Yuchen Fan and
               Ning Xu},
  title     = {Video Instance Segmentation},
  journal   = {CoRR},
  volume    = {abs/1905.04804},
  year      = {2019},
  url       = {http://arxiv.org/abs/1905.04804},
  archivePrefix = {arXiv},
  eprint    = {1905.04804},
  timestamp = {Tue, 28 May 2019 12:48:08 +0200},
  biburl    = {https://dblp.org/rec/journals/corr/abs-1905-04804.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

youtube_vis/पूर्ण (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फ़िग विवरण: डाटासेट से भरा संकल्प संस्करण, लेबल के बिना उन, शामिल सहित सभी फ्रेम, के साथ।

  • डेटासेट का आकार: 33.31 GiB

  • विभाजन:

विभाजित करना उदाहरण
'test' 343
'train' 2,238
'validation' ३०२
  • विशेषताएं:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})

youtube_vis/480_640_पूर्ण

  • कॉन्फ़िग विवरण: सभी छवियों bilinearly सभी फ्रेम शामिल साथ 480 x 640 करने के लिए बदला गया है।

  • डेटासेट का आकार: 130.02 GiB

  • विभाजन:

विभाजित करना उदाहरण
'test' 343
'train' 2,238
'validation' ३०२
  • विशेषताएं:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

youtube_vis/480_640_only_frames_with_labels

  • कॉन्फ़िग विवरण: सभी छवियों bilinearly शामिल लेबल के साथ ही फ्रेम के साथ 480 x 640 करने के लिए बदला गया है।

  • डेटासेट का आकार: 26.27 GiB

  • विभाजन:

विभाजित करना उदाहरण
'test' 343
'train' 2,238
'validation' ३०२
  • विशेषताएं:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

youtube_vis/only_frames_with_labels

  • कॉन्फ़िग विवरण: अपने मूल संकल्प में शामिल लेबल के साथ केवल वही चित्र।

  • डेटासेट का आकार: 6.91 GiB

  • विभाजन:

विभाजित करना उदाहरण
'test' 343
'train' 2,238
'validation' 302
  • विशेषताएं:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})

youtube_vis/full_train_split

  • कॉन्फ़िग विवरण: डाटासेट से भरा संकल्प संस्करण, लेबल के बिना उन, शामिल सहित सभी फ्रेम, के साथ। वैल और टेस्ट स्प्लिट्स प्रशिक्षण डेटा से निर्मित होते हैं।

  • डेटासेट का आकार: 26.09 GiB

  • विभाजन:

विभाजित करना उदाहरण
'test' 200
'train' 1,838
'validation' 200
  • विशेषताएं:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})

youtube_vis/480_640_full_train_split

  • कॉन्फ़िग विवरण: सभी छवियों bilinearly सभी फ्रेम शामिल साथ 480 x 640 करने के लिए बदला गया है। वैल और टेस्ट स्प्लिट्स प्रशिक्षण डेटा से निर्मित होते हैं।

  • डेटासेट का आकार: 101.57 GiB

  • विभाजन:

विभाजित करना उदाहरण
'test' 200
'train' 1,838
'validation' 200
  • विशेषताएं:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

youtube_vis/480_640_only_frames_with_labels_train_split

  • कॉन्फ़िग विवरण: सभी छवियों bilinearly शामिल लेबल के साथ ही फ्रेम के साथ 480 x 640 करने के लिए बदला गया है। वैल और टेस्ट स्प्लिट्स प्रशिक्षण डेटा से निर्मित होते हैं।

  • डेटासेट का आकार: 20.55 GiB

  • विभाजन:

विभाजित करना उदाहरण
'test' 200
'train' 1,838
'validation' 200
  • विशेषताएं:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

youtube_vis/only_frames_with_labels_train_split

  • कॉन्फ़िग विवरण: अपने मूल संकल्प में शामिल लेबल के साथ केवल वही चित्र। वैल और टेस्ट स्प्लिट्स प्रशिक्षण डेटा से निर्मित होते हैं।

  • डेटासेट का आकार: 5.46 GiB

  • विभाजन:

विभाजित करना उदाहरण
'test' 200
'train' 1,838
'validation' 200
  • विशेषताएं:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})