webvid

  • Descrizione :

WebVid è un set di dati su larga scala di brevi video con descrizioni testuali provenienti dal web. I video sono diversi e ricchi di contenuti.

WebVid-10M contiene:

10,7 milioni di coppie di sottotitoli video. 52.000 ore video totali.

  • Pagina iniziale : https://m-bain.github.io/webvid-dataset/

  • Codice sorgente : tfds.datasets.webvid.Builder

  • Versioni :

    • 1.0.0 (impostazione predefinita): versione iniziale.
  • Dimensioni del download : Unknown size

  • Dimensioni del set di dati : Unknown size

  • Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in download_config.manual_dir (il valore predefinito è ~/tensorflow_datasets/downloads/manual/ ):
    Segui le istruzioni per il download in https://m-bain.github.io/webvid-dataset/ per ottenere i dati. Posiziona i file csv e le directory video in manual_dir/webvid , in modo tale che i file mp4 vengano inseriti in manual_dir/webvid/*/*_*/*.mp4 .

La prima directory è tipicamente una directory parziale arbitraria (per il download frammentato), la seconda directory è la directory della pagina (due numeri attorno al trattino basso), all'interno della quale sono presenti uno o più file mp4.

Diviso Esempi
  • Struttura delle caratteristiche :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
didascalia Testo corda
id Testo corda
URL Testo corda
video Video (Immagine) (Nessuno, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}
,

  • Descrizione :

WebVid è un set di dati su larga scala di brevi video con descrizioni testuali provenienti dal web. I video sono diversi e ricchi di contenuti.

WebVid-10M contiene:

10,7 milioni di coppie di sottotitoli video. 52.000 ore video totali.

  • Pagina iniziale : https://m-bain.github.io/webvid-dataset/

  • Codice sorgente : tfds.datasets.webvid.Builder

  • Versioni :

    • 1.0.0 (impostazione predefinita): versione iniziale.
  • Dimensioni del download : Unknown size

  • Dimensioni del set di dati : Unknown size

  • Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in download_config.manual_dir (il valore predefinito è ~/tensorflow_datasets/downloads/manual/ ):
    Segui le istruzioni per il download in https://m-bain.github.io/webvid-dataset/ per ottenere i dati. Posiziona i file csv e le directory video in manual_dir/webvid , in modo tale che i file mp4 vengano inseriti in manual_dir/webvid/*/*_*/*.mp4 .

La prima directory è tipicamente una directory parziale arbitraria (per il download frammentato), la seconda directory è la directory della pagina (due numeri attorno al trattino basso), all'interno della quale sono presenti uno o più file mp4.

Diviso Esempi
  • Struttura delle caratteristiche :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
didascalia Testo corda
id Testo corda
URL Testo corda
video Video (Immagine) (Nessuno, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}