вебвид

  • Описание :

WebVid — это крупномасштабный набор коротких видеороликов с текстовыми описаниями, полученными из Интернета. Видео разнообразны и богаты своим содержанием.

WebVid-10M содержит:

10,7 млн ​​пар видео-субтитров. Общее количество часов видео 52 000.

  • Домашняя страница : https://m-bain.github.io/webvid-dataset/

  • Исходный код : tfds.datasets.webvid.Builder

  • Версии :

    • 1.0.0 (по умолчанию): Первоначальный выпуск.
  • Размер загрузки : Unknown size

  • Размер набора данных : Unknown size

  • Инструкции по ручной загрузке : этот набор данных требует, чтобы вы загружали исходные данные вручную в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    Следуйте инструкциям по загрузке в https://m-bain.github.io/webvid-dataset/ , чтобы получить данные. Поместите файлы csv и каталоги видео в manual_dir/webvid , чтобы файлы mp4 были помещены в manual_dir/webvid/*/*_*/*.mp4 .

Первый каталог обычно представляет собой каталог произвольной части (для сегментированной загрузки), второй каталог — это каталог страницы (два числа вокруг подчеркивания), внутри которого находится один или несколько файлов mp4.

Расколоть Примеры
  • Структура функции :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
ОсобенностиDict
подпись Текст нить
идентификатор Текст нить
URL Текст нить
видео Видео (изображение) (Нет, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}
,

  • Описание :

WebVid — это крупномасштабный набор коротких видеороликов с текстовыми описаниями, полученными из Интернета. Видео разнообразны и богаты своим содержанием.

WebVid-10M содержит:

10,7 млн ​​пар видео-субтитров. Общее количество часов видео 52 000.

  • Домашняя страница : https://m-bain.github.io/webvid-dataset/

  • Исходный код : tfds.datasets.webvid.Builder

  • Версии :

    • 1.0.0 (по умолчанию): Первоначальный выпуск.
  • Размер загрузки : Unknown size

  • Размер набора данных : Unknown size

  • Инструкции по ручной загрузке : этот набор данных требует, чтобы вы загружали исходные данные вручную в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    Следуйте инструкциям по загрузке в https://m-bain.github.io/webvid-dataset/ , чтобы получить данные. Поместите файлы csv и каталоги видео в manual_dir/webvid , чтобы файлы mp4 были помещены в manual_dir/webvid/*/*_*/*.mp4 .

Первый каталог обычно представляет собой каталог произвольной части (для сегментированной загрузки), второй каталог — это каталог страницы (два числа вокруг подчеркивания), внутри которого находится один или несколько файлов mp4.

Расколоть Примеры
  • Структура функции :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
ОсобенностиDict
подпись Текст нить
идентификатор Текст нить
URL Текст нить
видео Видео (изображение) (Нет, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}