ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

youtube_vis

  • รายละเอียด:

Youtube-vis เป็นชุดข้อมูลการแบ่งกลุ่มตัวอย่างวิดีโอ ประกอบด้วยวิดีโอ YouTube ความละเอียดสูง 2,883 รายการ ชุดป้ายกำกับหมวดหมู่ต่อพิกเซลรวมถึงวัตถุทั่วไป 40 รายการ เช่น บุคคล สัตว์ และยานพาหนะ อินสแตนซ์วิดีโอที่ไม่ซ้ำกัน 4,883 รายการ และคำอธิบายประกอบด้วยตนเองคุณภาพสูง 131k

ชุดข้อมูล YouTube-VIS แบ่งออกเป็นวิดีโอฝึกอบรม 2,238 รายการ วิดีโอตรวจสอบความถูกต้อง 302 รายการ และวิดีโอทดสอบ 343 รายการ

ไม่มีไฟล์ใดถูกลบหรือแก้ไขระหว่างการประมวลผลล่วงหน้า

  • โฮมเพจ: https://youtube-vos.org/dataset/vis/

  • รหัสที่มา: tfds.video.youtube_vis.YoutubeVis

  • รุ่น:

    • 1.0.0 (เริ่มต้น): เริ่มต้นปล่อย
  • ขนาดการดาวน์โหลด: Unknown size

  • คำแนะนำการดาวน์โหลดคู่มือ: ชุดนี้คุณจะต้องดาวน์โหลดข้อมูลแหล่งที่มาของตนเองลงใน download_config.manual_dir (ค่าเริ่มต้น ~/tensorflow_datasets/downloads/manual/ ):
    โปรดดาวน์โหลดไฟล์ทั้งหมดสำหรับชุดข้อมูลเวอร์ชัน 2019 (test_all_frames.zip, test.json, train_all_frames.zip, train.json, valid_all_frames.zip, valid.json) จากเว็บไซต์ youtube-vis และย้ายไปที่ ~/tensorflow_datasets/ ดาวน์โหลด/คู่มือ/.

โปรดทราบว่าหน้าชุดข้อมูลที่เชื่อมโยงไปถึงตั้งอยู่ที่ https://youtube-vos.org/dataset/vis/, และมันจะนำคุณไปยังหน้าบน https://competitions.codalab.org ที่คุณสามารถดาวน์โหลดรุ่น 2019 ของชุดข้อมูล คุณจะต้องสร้างบัญชีบน codalab เพื่อดาวน์โหลดข้อมูล โปรดทราบว่าในขณะที่เขียนสิ่งนี้ คุณจะต้องข้ามคำเตือน "การเชื่อมต่อไม่ปลอดภัย" เมื่อเข้าถึง codalab

  • ออโต้แคช ( เอกสาร ): ไม่มี

  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): None

  • รูป ( tfds.show_examples ): ไม่ได้รับการสนับสนุน

  • อ้างอิง:

@article{DBLP:journals/corr/abs-1905-04804,
  author    = {Linjie Yang and
               Yuchen Fan and
               Ning Xu},
  title     = {Video Instance Segmentation},
  journal   = {CoRR},
  volume    = {abs/1905.04804},
  year      = {2019},
  url       = {http://arxiv.org/abs/1905.04804},
  archivePrefix = {arXiv},
  eprint    = {1905.04804},
  timestamp = {Tue, 28 May 2019 12:48:08 +0200},
  biburl    = {https://dblp.org/rec/journals/corr/abs-1905-04804.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

youtube_vis/full (การกำหนดค่าเริ่มต้น)

  • คำอธิบาย Config: รุ่นความละเอียดเต็มรูปแบบของชุดข้อมูลที่มีเฟรมทั้งหมดรวมทั้งผู้ที่ไม่มีฉลากรวม

  • ขนาดชุด: 33.31 GiB

  • แยก:

แยก ตัวอย่าง
'test' 343
'train' 2,238
'validation' 302
  • คุณสมบัติ:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})

youtube_vis/480_640_full

  • คำอธิบาย Config: ภาพทั้งหมดจะถูกปรับขนาด bilinearly ถึง 480 x 640 ที่มีกรอบรวมทั้งหมด

  • ขนาดชุด: 130.02 GiB

  • แยก:

แยก ตัวอย่าง
'test' 343
'train' 2,238
'validation' 302
  • คุณสมบัติ:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

youtube_vis/480_640_only_frames_with_labels

  • คำอธิบาย Config: ภาพทั้งหมดจะถูกปรับขนาด bilinearly ถึง 480 x 640 ที่มีกรอบเท่านั้นที่มีฉลากรวม

  • ขนาดชุด: 26.27 GiB

  • แยก:

แยก ตัวอย่าง
'test' 343
'train' 2,238
'validation' 302
  • คุณสมบัติ:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

youtube_vis/only_frames_with_labels

  • คำอธิบาย Config: เฉพาะภาพที่มีป้ายชื่อรวมอยู่ที่ความละเอียดพื้นเมืองของพวกเขา

  • ขนาดชุด: 6.91 GiB

  • แยก:

แยก ตัวอย่าง
'test' 343
'train' 2,238
'validation' 302
  • คุณสมบัติ:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})

youtube_vis/full_train_split

  • คำอธิบาย Config: รุ่นความละเอียดเต็มรูปแบบของชุดข้อมูลที่มีเฟรมทั้งหมดรวมทั้งผู้ที่ไม่มีฉลากรวม วาลและตัวแยกทดสอบผลิตขึ้นจากข้อมูลการฝึก

  • ขนาดชุด: 26.09 GiB

  • แยก:

แยก ตัวอย่าง
'test' 200
'train' 1,838
'validation' 200
  • คุณสมบัติ:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})

youtube_vis/480_640_full_train_split

  • คำอธิบาย Config: ภาพทั้งหมดจะถูกปรับขนาด bilinearly ถึง 480 x 640 ที่มีกรอบรวมทั้งหมด การแบ่งวาลและการทดสอบผลิตขึ้นจากข้อมูลการฝึก

  • ขนาดชุด: 101.57 GiB

  • แยก:

แยก ตัวอย่าง
'test' 200
'train' 1,838
'validation' 200
  • คุณสมบัติ:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

youtube_vis/480_640_only_frames_with_labels_train_split

  • คำอธิบาย Config: ภาพทั้งหมดจะถูกปรับขนาด bilinearly ถึง 480 x 640 ที่มีกรอบเท่านั้นที่มีฉลากรวม วาลและตัวแยกทดสอบผลิตขึ้นจากข้อมูลการฝึก

  • ขนาดชุด: 20.55 GiB

  • แยก:

แยก ตัวอย่าง
'test' 200
'train' 1,838
'validation' 200
  • คุณสมบัติ:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(480, 640, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

youtube_vis/only_frames_with_labels_train_split

  • คำอธิบาย Config: เฉพาะภาพที่มีป้ายชื่อรวมอยู่ที่ความละเอียดพื้นเมืองของพวกเขา วาลและตัวแยกทดสอบผลิตขึ้นจากข้อมูลการฝึก

  • ขนาดชุด: 5.46 GiB

  • แยก:

แยก ตัวอย่าง
'test' 200
'train' 1,838
'validation' 200
  • คุณสมบัติ:
FeaturesDict({
    'metadata': FeaturesDict({
        'height': tf.int32,
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'areas': Sequence(tf.float32),
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'segmentations': Video(Image(shape=(None, None, 1), dtype=tf.uint8)),
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})