タオ

  • 説明

TAOデータセットは、2,907の高解像度ビデオと833のオブジェクトカテゴリで構成される大規模なビデオオブジェクト検出データセットです。このデータセットを保存するには、少なくとも300GBの空き容量が必要であることに注意してください。

  • ホームページhttps://taodataset.org/

  • ソースコードtfds.video.tao.Tao

  • バージョン

    • 1.0.0 (デフォルト):初期リリース。
  • ダウンロードサイズ113.96 GiB

  • マニュアルダウンロード方法:このデータセットは、手動にソースデータをダウンロードする必要がありますdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ):
    一部のTAOファイル(HVACSおよびAVAビデオ)は、MOTへのログインが必要なため、手動でダウンロードする必要があります。ダウンロードして、これらのデータは、時の指示に従ってくださいhttps://motchallenge.net/tao_download.php

このデータをダウンロードし、結果の.zipファイルを〜/ tensorflow_datasets / downloads / manual /に移動します

手動ダウンロードが必要なデータが存在しない場合はスキップされ、手動ダウンロードが不要なデータのみが使用されます。

スプリット
'train' 500
'validation' 988
@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

tao / 480_640(デフォルト設定)

  • コンフィグの説明:すべての画像をバイリニア480 X 640にリサイズされています

  • データセットのサイズ482.30 GiB

  • 特長

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': tf.string,
        'height': tf.int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=363),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'scale_category': tf.string,
        'track_id': tf.int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})

tao / full_resolution

  • コンフィグの説明:データセットのフル解像度バージョン。

  • データセットのサイズ171.24 GiB

  • 特長

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': tf.string,
        'height': tf.int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=363),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'scale_category': tf.string,
        'track_id': tf.int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})