tao

  • Açıklama :

TAO veri seti, 2.907 yüksek çözünürlüklü video ve 833 nesne kategorisinden oluşan büyük bir video nesnesi algılama veri setidir. Bu veri kümesinin depolanması için en az 300 GB boş alan gerektirdiğini unutmayın.

  • Ana sayfa : https://taodataset.org/

  • Kaynak kodu : tfds.video.tao.Tao

  • Sürümler :

    • 1.0.0 (varsayılan): İlk sürüm.
  • İndirme boyutu : 113.96 GiB

  • Manuel indirme talimatları : Bu veri kümesi, kaynak verileri download_config.manual_dir içine manuel olarak download_config.manual_dir gerektirir (varsayılanı ~/tensorflow_datasets/downloads/manual/ ):
    Bazı TAO dosyaları (HVACS ve AVA videoları) MOT'ta oturum açılması gerektiğinden manuel olarak indirilmelidir. Lütfen https://motchallenge.net/tao_download.php adresindeki talimatları izleyerek bu verileri indirin ve

Bu verileri indirin ve elde edilen .zip dosyalarını ~/tensorflow_datasets/downloads/manual/ dizinine taşıyın.

Manuel indirme gerektiren veriler mevcut değilse, atlanacak ve sadece manuel indirme gerektirmeyen veriler kullanılacaktır.

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölmeler :

Bölmek Örnekler
'train' 500
'validation' 988
@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

tao/480_640 (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Tüm görüntüler iki zamanlı olarak 480 X 640 olarak yeniden boyutlandırılır

  • Veri kümesi boyutu : 482.30 GiB

  • Özellik yapısı :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': tf.string,
        'height': tf.int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=363),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'scale_category': tf.string,
        'track_id': tf.int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
meta veri ÖzelliklerDict
meta veri/veri kümesi tensör tf.string
meta veri/yükseklik tensör tf.int32
meta veri/neg_category_ids tensör (Hiçbiri,) tf.int32
metadata/değil_exhaustive_category_ids tensör (Hiçbiri,) tf.int32
meta veri/num_frames tensör tf.int32
meta veri/video_adı tensör tf.string
meta veri/genişlik tensör tf.int32
izler Sekans
parçalar/bbox'lar Sıra(BBoxFeature) (Yok, 4) tf.float32
parçalar/kategori sınıf etiketi tf.int64
izler/çerçeveler Sıra (Tensor) (Hiçbiri,) tf.int32
parçalar/is_crowd tensör tf.bool
parçalar/ölçek_kategorisi tensör tf.string
track/track_id tensör tf.int32
video Video(Resim) (Yok, 480, 640, 3) tf.uint8

tao/tam_çözünürlük

  • Yapılandırma açıklaması : Veri kümesinin tam çözünürlüklü sürümü.

  • Veri kümesi boyutu : 171.24 GiB

  • Özellik yapısı :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': tf.string,
        'height': tf.int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=363),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'scale_category': tf.string,
        'track_id': tf.int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
meta veri ÖzelliklerDict
meta veri/veri kümesi tensör tf.string
meta veri/yükseklik tensör tf.int32
meta veri/neg_category_ids tensör (Hiçbiri,) tf.int32
metadata/değil_exhaustive_category_ids tensör (Hiçbiri,) tf.int32
meta veri/num_frames tensör tf.int32
meta veri/video_adı tensör tf.string
meta veri/genişlik tensör tf.int32
izler Sekans
parçalar/bbox'lar Sıra(BBoxFeature) (Yok, 4) tf.float32
parçalar/kategori sınıf etiketi tf.int64
izler/çerçeveler Sıra (Tensor) (Hiçbiri,) tf.int32
parçalar/is_crowd tensör tf.bool
parçalar/ölçek_kategorisi tensör tf.string
track/track_id tensör tf.int32
video Video(Resim) (Yok, Yok, Yok, 3) tf.uint8