webvid

  • विवरण :

WebVid लघु वीडियो का एक बड़े पैमाने का डेटासेट है, जिसमें वेब से पाठ्य विवरण दिया गया है। वीडियो विविध और उनकी सामग्री में समृद्ध हैं।

WebVid-10M में शामिल हैं:

10.7M वीडियो-कैप्शन जोड़े। 52K कुल वीडियो घंटे।

  • होमपेज : https://m-bain.github.io/webvid-dataset/

  • स्रोत कोड : tfds.datasets.webvid.Builder

  • संस्करण :

    • 1.0.0 (डिफ़ॉल्ट): प्रारंभिक रिलीज़।
  • डाउनलोड आकार : Unknown size

  • डेटासेट का आकार : Unknown size

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    डेटा प्राप्त करने के लिए https://m-bain.github.io/webvid-dataset/ में डाउनलोड निर्देशों का पालन करें। csv फ़ाइलों और वीडियो निर्देशिकाओं को manual_dir/webvid में रखें, जैसे कि mp4 फ़ाइलें manual_dir/webvid/*/*_*/*.mp4 में रखी गई हों।

पहली निर्देशिका आम तौर पर एक मनमाना हिस्सा निर्देशिका (शार्ल्ड डाउनलोडिंग के लिए) होती है, दूसरी निर्देशिका पृष्ठ निर्देशिका (अंडरस्कोर के आसपास दो नंबर) होती है, जिसके अंदर एक या अधिक mp4 फाइलें होती हैं।

विभाजित करना उदाहरण
  • फ़ीचर संरचना :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
कैप्शन मूलपाठ डोरी
पहचान मूलपाठ डोरी
यूआरएल मूलपाठ डोरी
वीडियो वीडियो (छवि) (कोई नहीं, 360, 640, 3) uint8
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उदाहरण ( tfds.as_dataframe ): गुम।

  • उद्धरण :

@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}
,

  • विवरण :

WebVid लघु वीडियो का एक बड़े पैमाने का डेटासेट है, जिसमें वेब से पाठ्य विवरण दिया गया है। वीडियो विविध और उनकी सामग्री में समृद्ध हैं।

WebVid-10M में शामिल हैं:

10.7M वीडियो-कैप्शन जोड़े। 52K कुल वीडियो घंटे।

  • होमपेज : https://m-bain.github.io/webvid-dataset/

  • स्रोत कोड : tfds.datasets.webvid.Builder

  • संस्करण :

    • 1.0.0 (डिफ़ॉल्ट): प्रारंभिक रिलीज़।
  • डाउनलोड आकार : Unknown size

  • डेटासेट का आकार : Unknown size

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    डेटा प्राप्त करने के लिए https://m-bain.github.io/webvid-dataset/ में डाउनलोड निर्देशों का पालन करें। csv फ़ाइलों और वीडियो निर्देशिकाओं को manual_dir/webvid में रखें, जैसे कि mp4 फ़ाइलें manual_dir/webvid/*/*_*/*.mp4 में रखी गई हों।

पहली निर्देशिका आम तौर पर एक मनमाना हिस्सा निर्देशिका (शार्ल्ड डाउनलोडिंग के लिए) होती है, दूसरी निर्देशिका पृष्ठ निर्देशिका (अंडरस्कोर के आसपास दो नंबर) होती है, जिसके अंदर एक या अधिक mp4 फाइलें होती हैं।

विभाजित करना उदाहरण
  • फ़ीचर संरचना :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
कैप्शन मूलपाठ डोरी
पहचान मूलपाठ डोरी
यूआरएल मूलपाठ डोरी
वीडियो वीडियो (छवि) (कोई नहीं, 360, 640, 3) uint8
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उदाहरण ( tfds.as_dataframe ): गुम।

  • उद्धरण :

@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}