webvid

opis :

WebVid to wielkoskalowy zbiór krótkich filmów z tekstowymi opisami pochodzącymi z sieci. Filmy są różnorodne i bogate w treść.

WebVid-10M zawiera:

10,7 mln par napisów wideo. Łącznie 52 000 godzin wideo.

Strona główna : https://m-bain.github.io/webvid-dataset/
Kod źródłowy : tfds.datasets.webvid.Builder
Wersje :
- 1.0.0 (domyślnie): Wersja początkowa.
Rozmiar pliku do pobrania : Unknown size
Rozmiar zbioru danych : Unknown size
Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ ):
Postępuj zgodnie z instrukcjami pobierania w https://m-bain.github.io/webvid-dataset/ , aby pobrać dane. Umieść pliki csv i katalogi wideo w manual_dir/webvid , tak aby pliki mp4 zostały umieszczone w manual_dir/webvid/*/*_*/*.mp4 .

Pierwszy katalog to zazwyczaj dowolny katalog części (do pobierania fragmentów), drugi katalog to katalog stron (dwie cyfry wokół podkreślenia), wewnątrz którego znajduje się jeden lub więcej plików mp4.

Automatyczne buforowanie ( dokumentacja ): Nieznane
Podziały :

Podział	Przykłady

Struktura funkcji :

FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
podpis	Tekst		strunowy
ID	Tekst		strunowy
adres URL	Tekst		strunowy
wideo	Wideo (obraz)	(Brak, 360, 640, 3)	uint8

Klucze nadzorowane (Zobacz dokument as_supervised ): None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ): Brak.
Cytat :

@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

opis :

WebVid to wielkoskalowy zbiór krótkich filmów z tekstowymi opisami pochodzącymi z sieci. Filmy są różnorodne i bogate w treść.

WebVid-10M zawiera:

10,7 mln par napisów wideo. Łącznie 52 000 godzin wideo.

Strona główna : https://m-bain.github.io/webvid-dataset/
Kod źródłowy : tfds.datasets.webvid.Builder
Wersje :
- 1.0.0 (domyślnie): Wersja początkowa.
Rozmiar pliku do pobrania : Unknown size
Rozmiar zbioru danych : Unknown size
Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ ):
Postępuj zgodnie z instrukcjami pobierania w https://m-bain.github.io/webvid-dataset/ , aby pobrać dane. Umieść pliki csv i katalogi wideo w manual_dir/webvid , tak aby pliki mp4 zostały umieszczone w manual_dir/webvid/*/*_*/*.mp4 .

Automatyczne buforowanie ( dokumentacja ): Nieznane
Podziały :

Podział	Przykłady

Struktura funkcji :

FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
podpis	Tekst		strunowy
ID	Tekst		strunowy
adres URL	Tekst		strunowy
wideo	Wideo (obraz)	(Brak, 360, 640, 3)	uint8

Klucze nadzorowane (Zobacz dokument as_supervised ): None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ): Brak.
Cytat :

@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

webvid Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

webvid