- বর্ণনা :
TAO ডেটাসেট হল একটি বড় ভিডিও অবজেক্ট ডিটেকশন ডেটাসেট যাতে 2,907টি উচ্চ রেজোলিউশন ভিডিও এবং 833টি অবজেক্ট বিভাগ রয়েছে। মনে রাখবেন যে এই ডেটাসেটটি সঞ্চয় করার জন্য কমপক্ষে 300 GB মুক্ত স্থান প্রয়োজন৷
হোমপেজ : https://taodataset.org/
সোর্স কোড :
tfds.video.tao.Tao
সংস্করণ :
-
1.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই। -
1.1.0
: টেস্ট স্প্লিট যোগ করা হয়েছে।
-
ডাউনলোড সাইজঃ
113.96 GiB
ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে
download_config.manual_dir
এ ম্যানুয়ালি উৎস ডেটা ডাউনলোড করতে হবে (~/tensorflow_datasets/downloads/manual/
এ ডিফল্ট):
কিছু TAO ফাইল (HVACS এবং AVA ভিডিও) ম্যানুয়ালি ডাউনলোড করতে হবে কারণ MOT-তে লগইন করা প্রয়োজন। দয়া করে ডাউনলোড করুন এবং সেই ডেটাগুলি https://motchallenge.net/tao_download.php এ নির্দেশাবলী অনুসরণ করুন৷
এই ডেটা ডাউনলোড করুন এবং ফলস্বরূপ .zip ফাইলগুলিকে ~/tensorflow_datasets/downloads/manual/ এ সরান
ম্যানুয়াল ডাউনলোডের প্রয়োজনীয় ডেটা উপস্থিত না থাকলে, এটি এড়িয়ে যাবে এবং শুধুমাত্র সেই ডেটা ব্যবহার করা হবে যা ম্যানুয়াল ডাউনলোডের প্রয়োজন নেই৷
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 500 |
'validation' | 988 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@article{Dave_2020,
title={TAO: A Large-Scale Benchmark for Tracking Any Object},
ISBN={9783030585587},
ISSN={1611-3349},
url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
DOI={10.1007/978-3-030-58558-7_26},
journal={Lecture Notes in Computer Science},
publisher={Springer International Publishing},
author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
year={2020},
pages={436-454}
}
tao/480_640 (ডিফল্ট কনফিগারেশন)
কনফিগারেশনের বিবরণ : সমস্ত ছবি দ্বিরেখায় আকার পরিবর্তন করে 480 X 640 করা হয়েছে
ডেটাসেটের আকার :
482.30 GiB
বৈশিষ্ট্য গঠন :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': string,
'height': int32,
'neg_category_ids': Tensor(shape=(None,), dtype=int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
'num_frames': int32,
'video_name': string,
'width': int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
'frames': Sequence(int32),
'is_crowd': bool,
'scale_category': string,
'track_id': int32,
}),
'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
মেটাডেটা | ফিচারসডিক্ট | |||
মেটাডেটা/ডেটাসেট | টেনসর | স্ট্রিং | ||
মেটাডেটা/উচ্চতা | টেনসর | int32 | ||
মেটাডেটা/neg_category_ids | টেনসর | (কোনটিই নয়,) | int32 | |
মেটাডেটা/not_exhaustive_category_ids | টেনসর | (কোনটিই নয়,) | int32 | |
মেটাডেটা/সংখ্যা_ফ্রেম | টেনসর | int32 | ||
মেটাডেটা/ভিডিও_নাম | টেনসর | স্ট্রিং | ||
মেটাডেটা/প্রস্থ | টেনসর | int32 | ||
ট্র্যাক | সিকোয়েন্স | |||
ট্র্যাক/bboxes | সিকোয়েন্স (BBoxFeature) | (কোনটি নয়, 4) | float32 | |
ট্র্যাক/বিভাগ | ক্লাসলেবেল | int64 | ||
ট্র্যাক/ফ্রেম | ক্রম (টেনসর) | (কোনটিই নয়,) | int32 | |
ট্র্যাক/ইজ_ভিড় | টেনসর | bool | ||
ট্র্যাক/স্কেল_বিভাগ | টেনসর | স্ট্রিং | ||
ট্র্যাক/ট্র্যাক_আইডি | টেনসর | int32 | ||
ভিডিও | ভিডিও(ছবি) | (কোনটি নয়, 480, 640, 3) | uint8 |
- উদাহরণ ( tfds.as_dataframe ):
tao/full_resolution
কনফিগারেশনের বিবরণ : ডেটাসেটের সম্পূর্ণ রেজোলিউশন সংস্করণ।
ডেটাসেটের আকার :
171.24 GiB
বৈশিষ্ট্য গঠন :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': string,
'height': int32,
'neg_category_ids': Tensor(shape=(None,), dtype=int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
'num_frames': int32,
'video_name': string,
'width': int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
'frames': Sequence(int32),
'is_crowd': bool,
'scale_category': string,
'track_id': int32,
}),
'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
মেটাডেটা | ফিচারসডিক্ট | |||
মেটাডেটা/ডেটাসেট | টেনসর | স্ট্রিং | ||
মেটাডেটা/উচ্চতা | টেনসর | int32 | ||
মেটাডেটা/neg_category_ids | টেনসর | (কোনটিই নয়,) | int32 | |
মেটাডেটা/not_exhaustive_category_ids | টেনসর | (কোনটিই নয়,) | int32 | |
মেটাডেটা/সংখ্যা_ফ্রেম | টেনসর | int32 | ||
মেটাডেটা/ভিডিও_নাম | টেনসর | স্ট্রিং | ||
মেটাডেটা/প্রস্থ | টেনসর | int32 | ||
ট্র্যাক | সিকোয়েন্স | |||
ট্র্যাক/bboxes | সিকোয়েন্স (BBoxFeature) | (কোনটি নয়, 4) | float32 | |
ট্র্যাক/বিভাগ | ক্লাসলেবেল | int64 | ||
ট্র্যাক/ফ্রেম | ক্রম (টেনসর) | (কোনটিই নয়,) | int32 | |
ট্র্যাক/ইজ_ভিড় | টেনসর | bool | ||
ট্র্যাক/স্কেল_বিভাগ | টেনসর | স্ট্রিং | ||
ট্র্যাক/ট্র্যাক_আইডি | টেনসর | int32 | ||
ভিডিও | ভিডিও(ছবি) | (কোনটিই নয়, কোনটিই নয়, 3) | uint8 |
- উদাহরণ ( tfds.as_dataframe ):