tao

  • Açıklama :

TAO veri seti, 2.907 yüksek çözünürlüklü video ve 833 nesne kategorisinden oluşan büyük bir video nesne algılama veri setidir. Bu veri kümesinin saklanması için en az 300 GB boş alan gerektiğini unutmayın.

  • Ek Belgeler : Belgeleri Keşfedin

  • Anasayfa : https://taodataset.org/

  • Kaynak kodu : tfds.video.tao.Tao

  • sürümler :

    • 1.0.0 (varsayılan): İlk sürüm.
  • İndirme boyutu : 113.96 GiB

  • Manuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak download_config.manual_dir içine download_config.manual_dir gerektirir (varsayılan olarak ~/tensorflow_datasets/downloads/manual/ ):
    Bazı TAO dosyalarının (HVACS ve AVA videoları) MOT'ta oturum açılması gerektiğinden manuel olarak indirilmesi gerekir. Lütfen bu verileri https://motchallenge.net/tao_download.php adresindeki talimatları izleyerek indirin.

Bu verileri indirin ve ortaya çıkan .zip dosyalarını ~/tensorflow_datasets/downloads/manual/ konumuna taşıyın.

Manuel indirme gerektiren veri yoksa atlanacak ve sadece manuel indirme gerektirmeyen veri kullanılacaktır.

  • Otomatik önbelleğe alınmış ( belgeleme ): Hayır

  • bölmeler :

Bölmek örnekler
'train' 500
'validation' 988
@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

tao/480_640 (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Tüm görüntüler çift doğrusal olarak 480 X 640 olarak yeniden boyutlandırılır

  • Veri kümesi boyutu : 482.30 GiB

  • Özellik yapısı :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
meta veri ÖzelliklerDict
meta veri/veri kümesi tensör sicim
meta veri/yükseklik tensör int32
meta veri/neg_category_ids tensör (Hiçbiri,) int32
meta veri/not_exhaustive_category_ids tensör (Hiçbiri,) int32
meta veri/kare sayısı tensör int32
meta veri/video_adı tensör sicim
meta veri/genişlik tensör int32
izler Sekans
parçalar/b kutuları Sıra(BBoxFeature) (Yok, 4) şamandıra32
parçalar/kategori SınıfEtiketi int64
izler/çerçeveler Sıra(Tensor) (Hiçbiri,) int32
track/is_crowd tensör bool
izler/ölçek_kategori tensör sicim
izler/track_id tensör int32
video Video(Resim) (Yok, 480, 640, 3) uint8

tao/tam_çözünürlük

  • Yapılandırma açıklaması : Veri kümesinin tam çözünürlüklü sürümü.

  • Veri kümesi boyutu : 171.24 GiB

  • Özellik yapısı :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
meta veri ÖzelliklerDict
meta veri/veri kümesi tensör sicim
meta veri/yükseklik tensör int32
meta veri/neg_category_ids tensör (Hiçbiri,) int32
meta veri/not_exhaustive_category_ids tensör (Hiçbiri,) int32
meta veri/kare sayısı tensör int32
meta veri/video_adı tensör sicim
meta veri/genişlik tensör int32
izler Sekans
parçalar/b kutuları Sıra(BBoxFeature) (Yok, 4) şamandıra32
parçalar/kategori SınıfEtiketi int64
izler/çerçeveler Sıra(Tensor) (Hiçbiri,) int32
track/is_crowd tensör bool
izler/ölçek_kategori tensör sicim
izler/track_id tensör int32
video Video(Resim) (Yok, Yok, Yok, 3) uint8