webvid

  • opis :

WebVid to wielkoskalowy zbiór krótkich filmów z tekstowymi opisami pochodzącymi z sieci. Filmy są różnorodne i bogate w treść.

WebVid-10M zawiera:

10,7 mln par napisów wideo. Łącznie 52 000 godzin wideo.

  • Strona główna : https://m-bain.github.io/webvid-dataset/

  • Kod źródłowy : tfds.datasets.webvid.Builder

  • Wersje :

    • 1.0.0 (domyślnie): Wersja początkowa.
  • Rozmiar pliku do pobrania : Unknown size

  • Rozmiar zbioru danych : Unknown size

  • Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ ):
    Postępuj zgodnie z instrukcjami pobierania w https://m-bain.github.io/webvid-dataset/ , aby pobrać dane. Umieść pliki csv i katalogi wideo w manual_dir/webvid , tak aby pliki mp4 zostały umieszczone w manual_dir/webvid/*/*_*/*.mp4 .

Pierwszy katalog to zazwyczaj dowolny katalog części (do pobierania fragmentów), drugi katalog to katalog stron (dwie cyfry wokół podkreślenia), wewnątrz którego znajduje się jeden lub więcej plików mp4.

  • Automatyczne buforowanie ( dokumentacja ): Nieznane

  • Podziały :

Podział Przykłady
  • Struktura funkcji :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
podpis Tekst strunowy
ID Tekst strunowy
adres URL Tekst strunowy
wideo Wideo (obraz) (Brak, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}
,

  • opis :

WebVid to wielkoskalowy zbiór krótkich filmów z tekstowymi opisami pochodzącymi z sieci. Filmy są różnorodne i bogate w treść.

WebVid-10M zawiera:

10,7 mln par napisów wideo. Łącznie 52 000 godzin wideo.

  • Strona główna : https://m-bain.github.io/webvid-dataset/

  • Kod źródłowy : tfds.datasets.webvid.Builder

  • Wersje :

    • 1.0.0 (domyślnie): Wersja początkowa.
  • Rozmiar pliku do pobrania : Unknown size

  • Rozmiar zbioru danych : Unknown size

  • Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ ):
    Postępuj zgodnie z instrukcjami pobierania w https://m-bain.github.io/webvid-dataset/ , aby pobrać dane. Umieść pliki csv i katalogi wideo w manual_dir/webvid , tak aby pliki mp4 zostały umieszczone w manual_dir/webvid/*/*_*/*.mp4 .

Pierwszy katalog to zazwyczaj dowolny katalog części (do pobierania fragmentów), drugi katalog to katalog stron (dwie cyfry wokół podkreślenia), wewnątrz którego znajduje się jeden lub więcej plików mp4.

  • Automatyczne buforowanie ( dokumentacja ): Nieznane

  • Podziały :

Podział Przykłady
  • Struktura funkcji :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
podpis Tekst strunowy
ID Tekst strunowy
adres URL Tekst strunowy
wideo Wideo (obraz) (Brak, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}