tao

  • Description:

L'ensemble de données TAO est un grand ensemble de données de détection d'objets vidéo composé de 2 907 vidéos haute résolution et de 833 catégories d'objets. Notez que cet ensemble de données nécessite au moins 300 Go d'espace libre pour être stocké.

  • Page d' accueil: https://taodataset.org/

  • Code source: tfds.video.tao.Tao

  • versions:

    • 1.0.0 (par défaut): Version initiale.
  • Taille du téléchargement: 113.96 GiB

  • Instructions de téléchargement Manuel: Cet ensemble de données , vous devez télécharger les données source manuellement dans download_config.manual_dir (par défaut ~/tensorflow_datasets/downloads/manual/ ):
    Certains fichiers TAO (vidéos HVAC et AVA) doivent être téléchargés manuellement car une connexion au MOT est requise. S'il vous plaît télécharger et les données en suivant les instructions à https://motchallenge.net/tao_download.php

Téléchargez ces données et déplacez les fichiers .zip résultants vers ~/tensorflow_datasets/downloads/manual/

Si les données nécessitant un téléchargement manuel ne sont pas présentes, elles seront ignorées et seules les données ne nécessitant pas de téléchargement manuel seront utilisées.

Diviser Exemples
'train' 500
'validation' 988
@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

tao/480_640 (configuration par défaut)

  • Description Config: Toutes les images sont bilinéaire redimensionnée à 480 X 640

  • Taille Dataset: 482.30 GiB

  • Caractéristiques:

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': tf.string,
        'height': tf.int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=363),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'scale_category': tf.string,
        'track_id': tf.int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

tao/résolution_complète

  • Description Config: La version complète de la résolution de l'ensemble de données.

  • Taille Dataset: 171.24 GiB

  • Caractéristiques:

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': tf.string,
        'height': tf.int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=363),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'scale_category': tf.string,
        'track_id': tf.int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})