- Açıklama :
TAO veri seti, 2.907 yüksek çözünürlüklü video ve 833 nesne kategorisinden oluşan büyük bir video nesnesi algılama veri setidir. Bu veri kümesinin depolanması için en az 300 GB boş alan gerektirdiğini unutmayın.
Ana sayfa : https://taodataset.org/
Kaynak kodu :
tfds.video.tao.Tao
Sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
113.96 GiB
Manuel indirme talimatları : Bu veri kümesi, kaynak verileri download_config.manual_dir içine manuel olarak
download_config.manual_dir
gerektirir (varsayılanı~/tensorflow_datasets/downloads/manual/
):
Bazı TAO dosyaları (HVACS ve AVA videoları) MOT'ta oturum açılması gerektiğinden manuel olarak indirilmelidir. Lütfen https://motchallenge.net/tao_download.php adresindeki talimatları izleyerek bu verileri indirin ve
Bu verileri indirin ve elde edilen .zip dosyalarını ~/tensorflow_datasets/downloads/manual/ dizinine taşıyın.
Manuel indirme gerektiren veriler mevcut değilse, atlanacak ve sadece manuel indirme gerektirmeyen veriler kullanılacaktır.
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölmeler :
Bölmek | Örnekler |
---|---|
'train' | 500 |
'validation' | 988 |
Denetimli anahtarlar (bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmez.
alıntı :
@article{Dave_2020,
title={TAO: A Large-Scale Benchmark for Tracking Any Object},
ISBN={9783030585587},
ISSN={1611-3349},
url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
DOI={10.1007/978-3-030-58558-7_26},
journal={Lecture Notes in Computer Science},
publisher={Springer International Publishing},
author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
year={2020},
pages={436-454}
}
tao/480_640 (varsayılan yapılandırma)
Yapılandırma açıklaması : Tüm görüntüler iki zamanlı olarak 480 X 640 olarak yeniden boyutlandırılır
Veri kümesi boyutu :
482.30 GiB
Özellik yapısı :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': tf.string,
'height': tf.int32,
'neg_category_ids': Tensor(shape=(None,), dtype=tf.int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=tf.int32),
'num_frames': tf.int32,
'video_name': tf.string,
'width': tf.int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=363),
'frames': Sequence(tf.int32),
'is_crowd': tf.bool,
'scale_category': tf.string,
'track_id': tf.int32,
}),
'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
meta veri | ÖzelliklerDict | |||
meta veri/veri kümesi | tensör | tf.string | ||
meta veri/yükseklik | tensör | tf.int32 | ||
meta veri/neg_category_ids | tensör | (Hiçbiri,) | tf.int32 | |
metadata/değil_exhaustive_category_ids | tensör | (Hiçbiri,) | tf.int32 | |
meta veri/num_frames | tensör | tf.int32 | ||
meta veri/video_adı | tensör | tf.string | ||
meta veri/genişlik | tensör | tf.int32 | ||
izler | Sekans | |||
parçalar/bbox'lar | Sıra(BBoxFeature) | (Yok, 4) | tf.float32 | |
parçalar/kategori | sınıf etiketi | tf.int64 | ||
izler/çerçeveler | Sıra (Tensor) | (Hiçbiri,) | tf.int32 | |
parçalar/is_crowd | tensör | tf.bool | ||
parçalar/ölçek_kategorisi | tensör | tf.string | ||
track/track_id | tensör | tf.int32 | ||
video | Video(Resim) | (Yok, 480, 640, 3) | tf.uint8 |
- Örnekler ( tfds.as_dataframe ):
tao/tam_çözünürlük
Yapılandırma açıklaması : Veri kümesinin tam çözünürlüklü sürümü.
Veri kümesi boyutu :
171.24 GiB
Özellik yapısı :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': tf.string,
'height': tf.int32,
'neg_category_ids': Tensor(shape=(None,), dtype=tf.int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=tf.int32),
'num_frames': tf.int32,
'video_name': tf.string,
'width': tf.int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=363),
'frames': Sequence(tf.int32),
'is_crowd': tf.bool,
'scale_category': tf.string,
'track_id': tf.int32,
}),
'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
meta veri | ÖzelliklerDict | |||
meta veri/veri kümesi | tensör | tf.string | ||
meta veri/yükseklik | tensör | tf.int32 | ||
meta veri/neg_category_ids | tensör | (Hiçbiri,) | tf.int32 | |
metadata/değil_exhaustive_category_ids | tensör | (Hiçbiri,) | tf.int32 | |
meta veri/num_frames | tensör | tf.int32 | ||
meta veri/video_adı | tensör | tf.string | ||
meta veri/genişlik | tensör | tf.int32 | ||
izler | Sekans | |||
parçalar/bbox'lar | Sıra(BBoxFeature) | (Yok, 4) | tf.float32 | |
parçalar/kategori | sınıf etiketi | tf.int64 | ||
izler/çerçeveler | Sıra (Tensor) | (Hiçbiri,) | tf.int32 | |
parçalar/is_crowd | tensör | tf.bool | ||
parçalar/ölçek_kategorisi | tensör | tf.string | ||
track/track_id | tensör | tf.int32 | ||
video | Video(Resim) | (Yok, Yok, Yok, 3) | tf.uint8 |
- Örnekler ( tfds.as_dataframe ):