- Açıklama :
TAO veri seti, 2.907 yüksek çözünürlüklü video ve 833 nesne kategorisinden oluşan büyük bir video nesne algılama veri setidir. Bu veri kümesinin saklanması için en az 300 GB boş alan gerektiğini unutmayın.
Anasayfa : https://taodataset.org/
Kaynak kodu :
tfds.video.tao.Tao
sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
113.96 GiB
Manuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak download_config.manual_dir içine
download_config.manual_dir
gerektirir (varsayılan olarak~/tensorflow_datasets/downloads/manual/
):
Bazı TAO dosyalarının (HVACS ve AVA videoları) MOT'ta oturum açılması gerektiğinden manuel olarak indirilmesi gerekir. Lütfen bu verileri https://motchallenge.net/tao_download.php adresindeki talimatları izleyerek indirin.
Bu verileri indirin ve ortaya çıkan .zip dosyalarını ~/tensorflow_datasets/downloads/manual/ konumuna taşıyın.
Manuel indirme gerektiren veri yoksa atlanacak ve sadece manuel indirme gerektirmeyen veri kullanılacaktır.
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 500 |
'validation' | 988 |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@article{Dave_2020,
title={TAO: A Large-Scale Benchmark for Tracking Any Object},
ISBN={9783030585587},
ISSN={1611-3349},
url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
DOI={10.1007/978-3-030-58558-7_26},
journal={Lecture Notes in Computer Science},
publisher={Springer International Publishing},
author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
year={2020},
pages={436-454}
}
tao/480_640 (varsayılan yapılandırma)
Yapılandırma açıklaması : Tüm görüntüler çift doğrusal olarak 480 X 640 olarak yeniden boyutlandırılır
Veri kümesi boyutu :
482.30 GiB
Özellik yapısı :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': string,
'height': int32,
'neg_category_ids': Tensor(shape=(None,), dtype=int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
'num_frames': int32,
'video_name': string,
'width': int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
'frames': Sequence(int32),
'is_crowd': bool,
'scale_category': string,
'track_id': int32,
}),
'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
meta veri | ÖzelliklerDict | |||
meta veri/veri kümesi | tensör | sicim | ||
meta veri/yükseklik | tensör | int32 | ||
meta veri/neg_category_ids | tensör | (Hiçbiri,) | int32 | |
meta veri/not_exhaustive_category_ids | tensör | (Hiçbiri,) | int32 | |
meta veri/kare sayısı | tensör | int32 | ||
meta veri/video_adı | tensör | sicim | ||
meta veri/genişlik | tensör | int32 | ||
izler | Sekans | |||
parçalar/b kutuları | Sıra(BBoxFeature) | (Yok, 4) | şamandıra32 | |
parçalar/kategori | SınıfEtiketi | int64 | ||
izler/çerçeveler | Sıra(Tensor) | (Hiçbiri,) | int32 | |
track/is_crowd | tensör | bool | ||
izler/ölçek_kategori | tensör | sicim | ||
izler/track_id | tensör | int32 | ||
video | Video(Resim) | (Yok, 480, 640, 3) | uint8 |
- Örnekler ( tfds.as_dataframe ):
tao/tam_çözünürlük
Yapılandırma açıklaması : Veri kümesinin tam çözünürlüklü sürümü.
Veri kümesi boyutu :
171.24 GiB
Özellik yapısı :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': string,
'height': int32,
'neg_category_ids': Tensor(shape=(None,), dtype=int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
'num_frames': int32,
'video_name': string,
'width': int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
'frames': Sequence(int32),
'is_crowd': bool,
'scale_category': string,
'track_id': int32,
}),
'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
meta veri | ÖzelliklerDict | |||
meta veri/veri kümesi | tensör | sicim | ||
meta veri/yükseklik | tensör | int32 | ||
meta veri/neg_category_ids | tensör | (Hiçbiri,) | int32 | |
meta veri/not_exhaustive_category_ids | tensör | (Hiçbiri,) | int32 | |
meta veri/kare sayısı | tensör | int32 | ||
meta veri/video_adı | tensör | sicim | ||
meta veri/genişlik | tensör | int32 | ||
izler | Sekans | |||
parçalar/b kutuları | Sıra(BBoxFeature) | (Yok, 4) | şamandıra32 | |
parçalar/kategori | SınıfEtiketi | int64 | ||
izler/çerçeveler | Sıra(Tensor) | (Hiçbiri,) | int32 | |
track/is_crowd | tensör | bool | ||
izler/ölçek_kategori | tensör | sicim | ||
izler/track_id | tensör | int32 | ||
video | Video(Resim) | (Yok, Yok, Yok, 3) | uint8 |
- Örnekler ( tfds.as_dataframe ):