ताओ

  • विवरण :

TAO डेटासेट एक बड़ा वीडियो ऑब्जेक्ट डिटेक्शन डेटासेट है जिसमें 2,907 उच्च रिज़ॉल्यूशन वीडियो और 833 ऑब्जेक्ट श्रेणियां शामिल हैं। ध्यान दें कि इस डेटासेट को स्टोर करने के लिए कम से कम 300 जीबी खाली जगह चाहिए।

  • अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें

  • होमपेज : https://taodataset.org/

  • स्रोत कोड : tfds.video.tao.Tao

  • संस्करण :

    • 1.0.0 (डिफ़ॉल्ट): प्रारंभिक रिलीज़।
  • डाउनलोड आकार : 113.96 GiB

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    कुछ टीएओ फाइलें (एचवीएसीएस और एवीए वीडियो) को मैन्युअल रूप से डाउनलोड किया जाना चाहिए क्योंकि एमओटी में लॉगिन की आवश्यकता होती है। कृपया डाउनलोड करें और वह डेटा https://motchallenge.net/tao_download.php पर दिए गए निर्देशों का पालन करते हुए

इस डेटा को डाउनलोड करें और परिणामी .zip फ़ाइलों को ~/tensorflow_datasets/downloads/manual/ पर ले जाएं

यदि मैन्युअल डाउनलोड की आवश्यकता वाला डेटा मौजूद नहीं है, तो इसे छोड़ दिया जाएगा और केवल मैन्युअल डाउनलोड की आवश्यकता नहीं रखने वाले डेटा का उपयोग किया जाएगा।

विभाजित करना उदाहरण
'train' 500
'validation' 988
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

ताओ/480_640 (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फिग विवरण : सभी छवियों को बिलिनियरली आकार देकर 480 X 640 में बदल दिया गया है

  • डेटासेट का आकार : 482.30 GiB

  • फ़ीचर संरचना :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
मेटाडाटा विशेषताएं डिक्ट
मेटाडेटा / डेटासेट टेन्सर डोरी
मेटाडेटा/ऊंचाई टेन्सर int32
मेटाडेटा/neg_category_ids टेन्सर (कोई भी नहीं,) int32
मेटाडेटा/not_exhaustive_category_ids टेन्सर (कोई भी नहीं,) int32
मेटाडेटा/num_frames टेन्सर int32
मेटाडेटा/video_name टेन्सर डोरी
मेटाडेटा/चौड़ाई टेन्सर int32
पटरियों क्रम
ट्रैक / बॉक्स अनुक्रम (BBoxFeature) (कोई नहीं, 4) फ्लोट32
ट्रैक / श्रेणी क्लासलेबल int64
ट्रैक / फ्रेम अनुक्रम (टेंसर) (कोई भी नहीं,) int32
ट्रैक/is_crowd टेन्सर बूल
ट्रैक/स्केल_श्रेणी टेन्सर डोरी
ट्रैक/track_id टेन्सर int32
वीडियो वीडियो (छवि) (कोई नहीं, 480, 640, 3) uint8

ताओ/पूर्ण_संकल्प

  • कॉन्फ़िग विवरण : डेटासेट का पूर्ण रिज़ॉल्यूशन संस्करण।

  • डेटासेट का आकार : 171.24 GiB

  • फ़ीचर संरचना :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
मेटाडाटा विशेषताएं डिक्ट
मेटाडेटा / डेटासेट टेन्सर डोरी
मेटाडेटा/ऊंचाई टेन्सर int32
मेटाडेटा/neg_category_ids टेन्सर (कोई भी नहीं,) int32
मेटाडेटा/not_exhaustive_category_ids टेन्सर (कोई भी नहीं,) int32
मेटाडेटा/num_frames टेन्सर int32
मेटाडेटा/video_name टेन्सर डोरी
मेटाडेटा/चौड़ाई टेन्सर int32
पटरियों क्रम
ट्रैक / बॉक्स अनुक्रम (BBoxFeature) (कोई नहीं, 4) फ्लोट32
ट्रैक / श्रेणी क्लासलेबल int64
ट्रैक / फ्रेम अनुक्रम (टेंसर) (कोई भी नहीं,) int32
ट्रैक/is_crowd टेन्सर बूल
ट्रैक/स्केल_श्रेणी टेन्सर डोरी
ट्रैक/track_id टेन्सर int32
वीडियो वीडियो (छवि) (कोई नहीं, कोई नहीं, कोई नहीं, 3) uint8