- คำอธิบาย :
ชุดข้อมูล TAO เป็นชุดข้อมูลการตรวจจับวัตถุวิดีโอขนาดใหญ่ซึ่งประกอบด้วยวิดีโอความละเอียดสูง 2,907 รายการและหมวดหมู่วัตถุ 833 ประเภท โปรดทราบว่าชุดข้อมูลนี้ต้องการพื้นที่ว่างอย่างน้อย 300 GB ในการจัดเก็บ
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://taodataset.org/
รหัสแหล่งที่มา :
tfds.video.tao.Tao
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดการดาวน์โหลด :
113.96 GiB
คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน
download_config.manual_dir
(ค่าเริ่มต้นเป็น~/tensorflow_datasets/downloads/manual/
):
ต้องดาวน์โหลดไฟล์ TAO บางไฟล์ (วิดีโอ HVACS และ AVA) ด้วยตนเอง เนื่องจากจำเป็นต้องลงชื่อเข้าใช้ MOT โปรดดาวน์โหลดและข้อมูลเหล่านั้นตามคำแนะนำที่ https://motchallenge.net/tao_download.php
ดาวน์โหลดข้อมูลนี้และย้ายไฟล์ .zip ที่ได้ไปยัง ~/tensorflow_datasets/downloads/manual/
หากไม่มีข้อมูลที่ต้องดาวน์โหลดด้วยตนเอง ข้อมูลนั้นจะถูกข้ามไปและจะใช้เฉพาะข้อมูลที่ไม่ต้องดาวน์โหลดด้วยตนเองเท่านั้น
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 500 |
'validation' | 988 |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :
@article{Dave_2020,
title={TAO: A Large-Scale Benchmark for Tracking Any Object},
ISBN={9783030585587},
ISSN={1611-3349},
url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
DOI={10.1007/978-3-030-58558-7_26},
journal={Lecture Notes in Computer Science},
publisher={Springer International Publishing},
author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
year={2020},
pages={436-454}
}
tao/480_640 (การกำหนดค่าเริ่มต้น)
คำอธิบาย การกำหนดค่า : รูปภาพทั้งหมดได้รับการปรับขนาดแบบทวิภาคเป็น 480 X 640
ขนาดชุดข้อมูล :
482.30 GiB
โครงสร้างคุณลักษณะ :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': string,
'height': int32,
'neg_category_ids': Tensor(shape=(None,), dtype=int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
'num_frames': int32,
'video_name': string,
'width': int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
'frames': Sequence(int32),
'is_crowd': bool,
'scale_category': string,
'track_id': int32,
}),
'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ข้อมูลเมตา | คุณสมบัติDict | |||
ข้อมูลเมตา/ชุดข้อมูล | เทนเซอร์ | สตริง | ||
ข้อมูลเมตา/ความสูง | เทนเซอร์ | int32 | ||
ข้อมูลเมตา/neg_category_ids | เทนเซอร์ | (ไม่มี,) | int32 | |
ข้อมูลเมตา/not_exhaustive_category_ids | เทนเซอร์ | (ไม่มี,) | int32 | |
ข้อมูลเมตา/num_frames | เทนเซอร์ | int32 | ||
ข้อมูลเมตา/ชื่อวิดีโอ | เทนเซอร์ | สตริง | ||
ข้อมูลเมตา/ความกว้าง | เทนเซอร์ | int32 | ||
เพลง | ลำดับ | |||
แทร็ก/บ็อกซ์ | ลำดับ (BBoxFeature) | (ไม่มี 4) | ลอย32 | |
แทร็ก/หมวดหมู่ | ป้ายกำกับคลาส | int64 | ||
แทร็ก / เฟรม | ลำดับ (เทนเซอร์) | (ไม่มี,) | int32 | |
แทร็ก/is_crowd | เทนเซอร์ | บูล | ||
แทร็ก/scale_category | เทนเซอร์ | สตริง | ||
แทร็ก/track_id | เทนเซอร์ | int32 | ||
วิดีโอ | วิดีโอ (รูปภาพ) | (ไม่มี, 480, 640, 3) | uint8 |
- ตัวอย่าง ( tfds.as_dataframe ):
เต๋า/full_resolution
คำอธิบาย การกำหนดค่า : เวอร์ชันความละเอียดเต็มของชุดข้อมูล
ขนาดชุดข้อมูล :
171.24 GiB
โครงสร้างคุณลักษณะ :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': string,
'height': int32,
'neg_category_ids': Tensor(shape=(None,), dtype=int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
'num_frames': int32,
'video_name': string,
'width': int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
'frames': Sequence(int32),
'is_crowd': bool,
'scale_category': string,
'track_id': int32,
}),
'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ข้อมูลเมตา | คุณสมบัติDict | |||
ข้อมูลเมตา/ชุดข้อมูล | เทนเซอร์ | สตริง | ||
ข้อมูลเมตา/ความสูง | เทนเซอร์ | int32 | ||
ข้อมูลเมตา/neg_category_ids | เทนเซอร์ | (ไม่มี,) | int32 | |
ข้อมูลเมตา/not_exhaustive_category_ids | เทนเซอร์ | (ไม่มี,) | int32 | |
ข้อมูลเมตา/num_frames | เทนเซอร์ | int32 | ||
ข้อมูลเมตา/ชื่อวิดีโอ | เทนเซอร์ | สตริง | ||
ข้อมูลเมตา/ความกว้าง | เทนเซอร์ | int32 | ||
เพลง | ลำดับ | |||
แทร็ก/บ็อกซ์ | ลำดับ (BBoxFeature) | (ไม่มี 4) | ลอย32 | |
แทร็ก/หมวดหมู่ | ป้ายกำกับคลาส | int64 | ||
แทร็ก / เฟรม | ลำดับ (เทนเซอร์) | (ไม่มี,) | int32 | |
แทร็ก/is_crowd | เทนเซอร์ | บูล | ||
แทร็ก/scale_category | เทนเซอร์ | สตริง | ||
แทร็ก/track_id | เทนเซอร์ | int32 | ||
วิดีโอ | วิดีโอ (รูปภาพ) | (ไม่มี ไม่มี ไม่มี 3) | uint8 |
- ตัวอย่าง ( tfds.as_dataframe ):