webvid

  • الوصف :

WebVid عبارة عن مجموعة بيانات واسعة النطاق من مقاطع الفيديو القصيرة ذات الأوصاف النصية التي يتم الحصول عليها من الويب. مقاطع الفيديو متنوعة وغنية بمحتواها.

يحتوي WebVid-10M على:

10.7 مليون زوج من مقاطع الفيديو التوضيحية. إجمالي 52 ألف ساعة فيديو.

  • الصفحة الرئيسية : https://m-bain.github.io/webvid-dataset/

  • كود المصدر : tfds.datasets.webvid.Builder

  • إصدارات :

    • 1.0.0 (افتراضي): الإصدار الأولي.
  • حجم التنزيل : Unknown size

  • حجم مجموعة البيانات : Unknown size

  • إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى download_config.manual_dir (الإعدادات الافتراضية على ~/tensorflow_datasets/downloads/manual/ ):
    اتبع تعليمات التنزيل في https://m-bain.github.io/webvid-dataset/ للحصول على البيانات. ضع ملفات csv وأدلة الفيديو في manual_dir/webvid ، بحيث يتم وضع ملفات mp4 في manual_dir/webvid/*/*_*/*.mp4 .

يكون الدليل الأول عادةً دليلًا عشوائيًا (للتنزيل المُقسَّم) ، والدليل الثاني هو دليل الصفحة (رقمان حول الشرطة السفلية) ، يوجد بداخله ملف MP4 واحد أو أكثر.

  • التخزين المؤقت التلقائي ( الوثائق ): غير معروف

  • الانقسامات :

ينقسم أمثلة
  • هيكل الميزة :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
التسمية التوضيحية نص خيط
بطاقة تعريف نص خيط
عنوان url نص خيط
فيديو فيديو (صورة) (لا شيء ، 360 ، 640 ، 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}
،

  • الوصف :

WebVid عبارة عن مجموعة بيانات واسعة النطاق من مقاطع الفيديو القصيرة ذات الأوصاف النصية التي يتم الحصول عليها من الويب. مقاطع الفيديو متنوعة وغنية بمحتواها.

يحتوي WebVid-10M على:

10.7 مليون زوج من مقاطع الفيديو التوضيحية. إجمالي 52 ألف ساعة فيديو.

  • الصفحة الرئيسية : https://m-bain.github.io/webvid-dataset/

  • كود المصدر : tfds.datasets.webvid.Builder

  • إصدارات :

    • 1.0.0 (افتراضي): الإصدار الأولي.
  • حجم التنزيل : Unknown size

  • حجم مجموعة البيانات : Unknown size

  • إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى download_config.manual_dir (الإعدادات الافتراضية على ~/tensorflow_datasets/downloads/manual/ ):
    اتبع تعليمات التنزيل في https://m-bain.github.io/webvid-dataset/ للحصول على البيانات. ضع ملفات csv وأدلة الفيديو في manual_dir/webvid ، بحيث يتم وضع ملفات mp4 في manual_dir/webvid/*/*_*/*.mp4 .

يكون الدليل الأول عادةً دليلًا عشوائيًا (للتنزيل المُقسَّم) ، والدليل الثاني هو دليل الصفحة (رقمان حول الشرطة السفلية) ، يوجد بداخله ملف MP4 واحد أو أكثر.

  • التخزين المؤقت التلقائي ( الوثائق ): غير معروف

  • الانقسامات :

ينقسم أمثلة
  • هيكل الميزة :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
التسمية التوضيحية نص خيط
بطاقة تعريف نص خيط
عنوان url نص خيط
فيديو فيديو (صورة) (لا شيء ، 360 ، 640 ، 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}