tao

Açıklama :

TAO veri seti, 2.907 yüksek çözünürlüklü video ve 833 nesne kategorisinden oluşan büyük bir video nesne algılama veri setidir. Bu veri kümesinin saklanması için en az 300 GB boş alan gerektiğini unutmayın.

Ek Belgeler : Belgeleri Keşfedin
Anasayfa : https://taodataset.org/
Kaynak kodu : tfds.video.tao.Tao
sürümler :
- 1.0.0 (varsayılan): İlk sürüm.
İndirme boyutu : 113.96 GiB
Manuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak download_config.manual_dir içine download_config.manual_dir gerektirir (varsayılan olarak ~/tensorflow_datasets/downloads/manual/ ):
Bazı TAO dosyalarının (HVACS ve AVA videoları) MOT'ta oturum açılması gerektiğinden manuel olarak indirilmesi gerekir. Lütfen bu verileri https://motchallenge.net/tao_download.php adresindeki talimatları izleyerek indirin.

Bu verileri indirin ve ortaya çıkan .zip dosyalarını ~/tensorflow_datasets/downloads/manual/ konumuna taşıyın.

Manuel indirme gerektiren veri yoksa atlanacak ve sadece manuel indirme gerektirmeyen veri kullanılacaktır.

Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :

Bölmek	örnekler
`'train'`	500
`'validation'`	988

Denetlenen anahtarlar (Bkz as_supervised doc ): None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :

@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

tao/480_640 (varsayılan yapılandırma)

Yapılandırma açıklaması : Tüm görüntüler çift doğrusal olarak 480 X 640 olarak yeniden boyutlandırılır
Veri kümesi boyutu : 482.30 GiB
Özellik yapısı :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
meta veri	ÖzelliklerDict
meta veri/veri kümesi	tensör		sicim
meta veri/yükseklik	tensör		int32
meta veri/neg_category_ids	tensör	(Hiçbiri,)	int32
meta veri/not_exhaustive_category_ids	tensör	(Hiçbiri,)	int32
meta veri/kare sayısı	tensör		int32
meta veri/video_adı	tensör		sicim
meta veri/genişlik	tensör		int32
izler	Sekans
parçalar/b kutuları	Sıra(BBoxFeature)	(Yok, 4)	şamandıra32
parçalar/kategori	SınıfEtiketi		int64
izler/çerçeveler	Sıra(Tensor)	(Hiçbiri,)	int32
track/is_crowd	tensör		bool
izler/ölçek_kategori	tensör		sicim
izler/track_id	tensör		int32
video	Video(Resim)	(Yok, 480, 640, 3)	uint8

Örnekler ( tfds.as_dataframe ):

tao/tam_çözünürlük

Yapılandırma açıklaması : Veri kümesinin tam çözünürlüklü sürümü.
Veri kümesi boyutu : 171.24 GiB
Özellik yapısı :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
meta veri	ÖzelliklerDict
meta veri/veri kümesi	tensör		sicim
meta veri/yükseklik	tensör		int32
meta veri/neg_category_ids	tensör	(Hiçbiri,)	int32
meta veri/not_exhaustive_category_ids	tensör	(Hiçbiri,)	int32
meta veri/kare sayısı	tensör		int32
meta veri/video_adı	tensör		sicim
meta veri/genişlik	tensör		int32
izler	Sekans
parçalar/b kutuları	Sıra(BBoxFeature)	(Yok, 4)	şamandıra32
parçalar/kategori	SınıfEtiketi		int64
izler/çerçeveler	Sıra(Tensor)	(Hiçbiri,)	int32
track/is_crowd	tensör		bool
izler/ölçek_kategori	tensör		sicim
izler/track_id	tensör		int32
video	Video(Resim)	(Yok, Yok, Yok, 3)	uint8

Örnekler ( tfds.as_dataframe ):