- विवरण :
TAO डेटासेट एक बड़ा वीडियो ऑब्जेक्ट डिटेक्शन डेटासेट है जिसमें 2,907 उच्च रिज़ॉल्यूशन वीडियो और 833 ऑब्जेक्ट श्रेणियां शामिल हैं। ध्यान दें कि इस डेटासेट को स्टोर करने के लिए कम से कम 300 जीबी खाली जगह चाहिए।
होमपेज : https://taodataset.org/
स्रोत कोड :
tfds.video.tao.Tao
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
113.96 GiB
मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से
download_config.manual_dir
(डिफ़ॉल्ट रूप से~/tensorflow_datasets/downloads/manual/
) में डाउनलोड करना होगा:
कुछ टीएओ फाइलें (एचवीएसीएस और एवीए वीडियो) को मैन्युअल रूप से डाउनलोड किया जाना चाहिए क्योंकि एमओटी में लॉगिन की आवश्यकता होती है। कृपया डाउनलोड करें और वह डेटा https://motchallenge.net/tao_download.php पर दिए गए निर्देशों का पालन करते हुए
इस डेटा को डाउनलोड करें और परिणामी .zip फ़ाइलों को ~/tensorflow_datasets/downloads/manual/ पर ले जाएं
यदि मैन्युअल डाउनलोड की आवश्यकता वाला डेटा मौजूद नहीं है, तो इसे छोड़ दिया जाएगा और केवल मैन्युअल डाउनलोड की आवश्यकता नहीं रखने वाले डेटा का उपयोग किया जाएगा।
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 500 |
'validation' | 988 |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@article{Dave_2020,
title={TAO: A Large-Scale Benchmark for Tracking Any Object},
ISBN={9783030585587},
ISSN={1611-3349},
url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
DOI={10.1007/978-3-030-58558-7_26},
journal={Lecture Notes in Computer Science},
publisher={Springer International Publishing},
author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
year={2020},
pages={436-454}
}
ताओ/480_640 (डिफ़ॉल्ट कॉन्फ़िगरेशन)
कॉन्फिग विवरण : सभी छवियों को बिलिनियरली आकार देकर 480 X 640 में बदल दिया गया है
डेटासेट का आकार :
482.30 GiB
फ़ीचर संरचना :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': string,
'height': int32,
'neg_category_ids': Tensor(shape=(None,), dtype=int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
'num_frames': int32,
'video_name': string,
'width': int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
'frames': Sequence(int32),
'is_crowd': bool,
'scale_category': string,
'track_id': int32,
}),
'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
मेटाडाटा | विशेषताएं डिक्ट | |||
मेटाडेटा / डेटासेट | टेन्सर | डोरी | ||
मेटाडेटा/ऊंचाई | टेन्सर | int32 | ||
मेटाडेटा/neg_category_ids | टेन्सर | (कोई भी नहीं,) | int32 | |
मेटाडेटा/not_exhaustive_category_ids | टेन्सर | (कोई भी नहीं,) | int32 | |
मेटाडेटा/num_frames | टेन्सर | int32 | ||
मेटाडेटा/video_name | टेन्सर | डोरी | ||
मेटाडेटा/चौड़ाई | टेन्सर | int32 | ||
पटरियों | क्रम | |||
ट्रैक / बॉक्स | अनुक्रम (BBoxFeature) | (कोई नहीं, 4) | फ्लोट32 | |
ट्रैक / श्रेणी | क्लासलेबल | int64 | ||
ट्रैक / फ्रेम | अनुक्रम (टेंसर) | (कोई भी नहीं,) | int32 | |
ट्रैक/is_crowd | टेन्सर | बूल | ||
ट्रैक/स्केल_श्रेणी | टेन्सर | डोरी | ||
ट्रैक/track_id | टेन्सर | int32 | ||
वीडियो | वीडियो (छवि) | (कोई नहीं, 480, 640, 3) | uint8 |
- उदाहरण ( tfds.as_dataframe ):
ताओ/पूर्ण_संकल्प
कॉन्फ़िग विवरण : डेटासेट का पूर्ण रिज़ॉल्यूशन संस्करण।
डेटासेट का आकार :
171.24 GiB
फ़ीचर संरचना :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': string,
'height': int32,
'neg_category_ids': Tensor(shape=(None,), dtype=int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
'num_frames': int32,
'video_name': string,
'width': int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
'frames': Sequence(int32),
'is_crowd': bool,
'scale_category': string,
'track_id': int32,
}),
'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
मेटाडाटा | विशेषताएं डिक्ट | |||
मेटाडेटा / डेटासेट | टेन्सर | डोरी | ||
मेटाडेटा/ऊंचाई | टेन्सर | int32 | ||
मेटाडेटा/neg_category_ids | टेन्सर | (कोई भी नहीं,) | int32 | |
मेटाडेटा/not_exhaustive_category_ids | टेन्सर | (कोई भी नहीं,) | int32 | |
मेटाडेटा/num_frames | टेन्सर | int32 | ||
मेटाडेटा/video_name | टेन्सर | डोरी | ||
मेटाडेटा/चौड़ाई | टेन्सर | int32 | ||
पटरियों | क्रम | |||
ट्रैक / बॉक्स | अनुक्रम (BBoxFeature) | (कोई नहीं, 4) | फ्लोट32 | |
ट्रैक / श्रेणी | क्लासलेबल | int64 | ||
ट्रैक / फ्रेम | अनुक्रम (टेंसर) | (कोई भी नहीं,) | int32 | |
ट्रैक/is_crowd | टेन्सर | बूल | ||
ट्रैक/स्केल_श्रेणी | टेन्सर | डोरी | ||
ट्रैक/track_id | टेन्सर | int32 | ||
वीडियो | वीडियो (छवि) | (कोई नहीं, कोई नहीं, कोई नहीं, 3) | uint8 |
- उदाहरण ( tfds.as_dataframe ):