एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

ताओ

  • विवरण:

टीएओ डेटासेट एक बड़ा वीडियो ऑब्जेक्ट डिटेक्शन डेटासेट है जिसमें 2,907 उच्च रिज़ॉल्यूशन वीडियो और 833 ऑब्जेक्ट श्रेणियां शामिल हैं। ध्यान दें कि इस डेटासेट को स्टोर करने के लिए कम से कम 300 जीबी खाली जगह चाहिए।

  • होमपेज: https://taodataset.org/

  • स्रोत कोड: tfds.video.tao.Tao

  • संस्करण:

    • 1.0.0 (डिफ़ॉल्ट): प्रारंभिक रिलीज़।
  • डाउनलोड का आकार: 113.96 GiB

  • मैनुअल डाउनलोड के निर्देश: यह डेटासेट आप में मैन्युअल रूप से स्रोत डेटा डाउनलोड करने के लिए की आवश्यकता है download_config.manual_dir (करने के लिए डिफ़ॉल्ट ~/tensorflow_datasets/downloads/manual/ ):
    कुछ टीएओ फाइलें (एचवीएसीएस और एवीए वीडियो) मैन्युअल रूप से डाउनलोड की जानी चाहिए क्योंकि एमओटी में लॉगिन की आवश्यकता होती है। कृपया डाउनलोड करने और उन डेटा पर निर्देशों का पालन https://motchallenge.net/tao_download.php

इस डेटा को डाउनलोड करें और परिणामी .zip फ़ाइलों को ~/tensorflow_datasets/downloads/manual/ पर ले जाएं।

यदि मैन्युअल डाउनलोड की आवश्यकता वाला डेटा मौजूद नहीं है, तो इसे छोड़ दिया जाएगा और केवल मैन्युअल डाउनलोड की आवश्यकता वाले डेटा का उपयोग नहीं किया जाएगा।

विभाजित करना उदाहरण
'train' 500
'validation' 988
  • पर्यवेक्षित कुंजियों (देखें as_supervised डॉक ): None

  • चित्रा ( tfds.show_examples ): समर्थित नहीं।

  • प्रशस्ति पत्र:

@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

ताओ/480_640 (डिफ़ॉल्ट विन्यास)

  • कॉन्फ़िग विवरण: सभी छवियों bilinearly 480 एक्स 640 को बदल दिया गया है

  • डेटासेट का आकार: 482.30 GiB

  • विशेषताएं:

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': tf.string,
        'height': tf.int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=363),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'scale_category': tf.string,
        'track_id': tf.int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

ताओ/पूर्ण_संकल्प

  • कॉन्फ़िग विवरण: डाटासेट से भरा संकल्प संस्करण।

  • डेटासेट का आकार: 171.24 GiB

  • विशेषताएं:

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': tf.string,
        'height': tf.int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=363),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'scale_category': tf.string,
        'track_id': tf.int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})