ucf101

  • 説明:

101 ラベルのビデオ分類データセット。

@article{DBLP:journals/corr/abs-1212-0402,
  author    = {Khurram Soomro and
               Amir Roshan Zamir and
               Mubarak Shah},
  title     = { {UCF101:} {A} Dataset of 101 Human Actions Classes From Videos in
               The Wild},
  journal   = {CoRR},
  volume    = {abs/1212.0402},
  year      = {2012},
  url       = {http://arxiv.org/abs/1212.0402},
  archivePrefix = {arXiv},
  eprint    = {1212.0402},
  timestamp = {Mon, 13 Aug 2018 16:47:45 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1212-0402},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

ucf101/ucf101_1_256 (デフォルト構成)

  • 構成の説明: 最初のアクション認識分割を含む 256x256 UCF。

  • データセットサイズ: 7.40 GiB

  • スプリット:

スプリット
'test' 3,783
'train' 9,537
  • 機能構造:
FeaturesDict({
    'label': ClassLabel(shape=(), dtype=int64, num_classes=101),
    'video': Video(Image(shape=(256, 256, 3), dtype=uint8)),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ラベルクラスラベルint64
ビデオ動画(画像) (なし、256、256、3) uint8

ucf101/ucf101_1

  • 構成の説明: アクション認識分割 #1 を使用した UCF。

  • データセットサイズ: 8.48 GiB

  • スプリット:

スプリット
'test' 3,783
'train' 9,537
  • 機能構造:
FeaturesDict({
    'label': ClassLabel(shape=(), dtype=int64, num_classes=101),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ラベルクラスラベルint64
ビデオ動画(画像) (なし、なし、なし、3) uint8

ucf101/ucf101_2

  • 構成の説明: アクション認識分割 #2 を使用した UCF。

  • データセットサイズ: 8.48 GiB

  • スプリット:

スプリット
'test' 3,734
'train' 9,586
  • 機能構造:
FeaturesDict({
    'label': ClassLabel(shape=(), dtype=int64, num_classes=101),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ラベルクラスラベルint64
ビデオ動画(画像) (なし、なし、なし、3) uint8

ucf101/ucf101_3

  • 構成の説明: アクション認識分割 #3 を使用した UCF。

  • データセットサイズ: 8.48 GiB

  • スプリット:

スプリット
'test' 3,696
'train' 9,624
  • 機能構造:
FeaturesDict({
    'label': ClassLabel(shape=(), dtype=int64, num_classes=101),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ラベルクラスラベルint64
ビデオ動画(画像) (なし、なし、なし、3) uint8