tao

  • বর্ণনা :

TAO ডেটাসেট হল একটি বৃহৎ ভিডিও অবজেক্ট ডিটেকশন ডেটাসেট যাতে 2,907টি উচ্চ রেজোলিউশন ভিডিও এবং 833টি অবজেক্ট বিভাগ রয়েছে। মনে রাখবেন যে এই ডেটাসেটটি সঞ্চয় করার জন্য কমপক্ষে 300 GB মুক্ত স্থান প্রয়োজন৷

  • অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন

  • হোমপেজ : https://taodataset.org/

  • সোর্স কোড : tfds.video.tao.Tao

  • সংস্করণ :

    • 1.0.0 (ডিফল্ট): প্রাথমিক প্রকাশ।
  • ডাউনলোড 113.96 GiB

  • ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে ডাউনলোড_config.manual_dir-এ ম্যানুয়ালি উৎস ডেটা download_config.manual_dir করতে হবে ( ~/tensorflow_datasets/downloads/manual/ ডিফল্ট):
    কিছু TAO ফাইল (HVACS এবং AVA ​​ভিডিও) ম্যানুয়ালি ডাউনলোড করতে হবে কারণ MOT-তে লগইন করা প্রয়োজন। দয়া করে ডাউনলোড করুন এবং সেই ডেটাগুলি https://motchallenge.net/tao_download.php এ নির্দেশাবলী অনুসরণ করুন৷

এই ডেটা ডাউনলোড করুন এবং ফলস্বরূপ .zip ফাইলগুলিকে ~/tensorflow_datasets/downloads/manual/ এ সরান

ম্যানুয়াল ডাউনলোডের প্রয়োজনীয় ডেটা উপস্থিত না থাকলে, এটি এড়িয়ে যাবে এবং শুধুমাত্র সেই ডেটা ব্যবহার করা হবে যা ম্যানুয়াল ডাউনলোডের প্রয়োজন নেই৷

বিভক্ত উদাহরণ
'train' 500
'validation' 988
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদ্ধৃতি :

@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

tao/480_640 (ডিফল্ট কনফিগারেশন)

  • কনফিগারেশনের বিবরণ : সমস্ত ছবি দ্বিরেখায় আকার পরিবর্তন করে 480 X 640 করা হয়েছে

  • ডেটাসেটের আকার : 482.30 GiB

  • বৈশিষ্ট্য গঠন :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
মেটাডেটা ফিচারসডিক্ট
মেটাডেটা/ডেটাসেট টেনসর স্ট্রিং
মেটাডেটা/উচ্চতা টেনসর int32
মেটাডেটা/neg_category_ids টেনসর (কোনটিই নয়,) int32
মেটাডেটা/not_exhaustive_category_ids টেনসর (কোনটিই নয়,) int32
মেটাডেটা/সংখ্যা_ফ্রেম টেনসর int32
মেটাডেটা/ভিডিও_নাম টেনসর স্ট্রিং
মেটাডেটা/প্রস্থ টেনসর int32
ট্র্যাক ক্রম
ট্র্যাক/bboxes সিকোয়েন্স (BBoxFeature) (কোনটি নয়, 4) float32
ট্র্যাক/বিভাগ ক্লাসলেবেল int64
ট্র্যাক/ফ্রেম ক্রম (টেনসর) (কোনটিই নয়,) int32
ট্র্যাক/ইজ_ভিড় টেনসর bool
ট্র্যাক/স্কেল_বিভাগ টেনসর স্ট্রিং
ট্র্যাক/ট্র্যাক_আইডি টেনসর int32
ভিডিও ভিডিও(ছবি) (কোনটি নয়, 480, 640, 3) uint8

tao/full_resolution

  • কনফিগারেশনের বিবরণ : ডেটাসেটের সম্পূর্ণ রেজোলিউশন সংস্করণ।

  • ডেটাসেটের আকার : 171.24 GiB

  • বৈশিষ্ট্য গঠন :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
মেটাডেটা ফিচারসডিক্ট
মেটাডেটা/ডেটাসেট টেনসর স্ট্রিং
মেটাডেটা/উচ্চতা টেনসর int32
মেটাডেটা/neg_category_ids টেনসর (কোনটিই নয়,) int32
মেটাডেটা/not_exhaustive_category_ids টেনসর (কোনটিই নয়,) int32
মেটাডেটা/সংখ্যা_ফ্রেম টেনসর int32
মেটাডেটা/ভিডিও_নাম টেনসর স্ট্রিং
মেটাডেটা/প্রস্থ টেনসর int32
ট্র্যাক ক্রম
ট্র্যাক/bboxes সিকোয়েন্স (BBoxFeature) (কোনটি নয়, 4) float32
ট্র্যাক/বিভাগ ক্লাসলেবেল int64
ট্র্যাক/ফ্রেম ক্রম (টেনসর) (কোনটিই নয়,) int32
ট্র্যাক/ইজ_ভিড় টেনসর bool
ট্র্যাক/স্কেল_বিভাগ টেনসর স্ট্রিং
ট্র্যাক/ট্র্যাক_আইডি টেনসর int32
ভিডিও ভিডিও(ছবি) (কোনটিই নয়, কোনটিই নয়, 3) uint8