فليك

من الورقة: جمعنا مجموعة بيانات صور 5003 تلقائيًا من أفلام هوليوود الشهيرة. تم الحصول على الصور عن طريق تشغيل جهاز كشف الأشخاص المتطور في كل إطار عاشر من 30 فيلمًا. تم بعد ذلك إرسال الأشخاص الذين تم اكتشافهم بثقة عالية (ما يقرب من 20 ألف مرشح) إلى سوق التعهيد الجماعي Amazon Mechanical Turk للحصول على علامة أرضية. تم شرح كل صورة بواسطة خمسة من التركيين مقابل 0.01 دولار لكل صورة لتسمية 10 مفاصل الجزء العلوي من الجسم. تم التقاط الوسم المتوسط ​​من خمسة في كل صورة ليكون قويًا للتعليقات التوضيحية الخارجية. أخيرًا ، تم رفض الصور يدويًا من قبلنا إذا كان الشخص محجوبًا أو غير أمامي بشدة. نخصص 20٪ (1016 صورة) من البيانات للاختبار.

انشق، مزق أمثلة
'test' 1،016
'train' 3،987
  • هيكل الميزة :
FeaturesDict({
    'currframe': float64,
    'image': Image(shape=(480, 720, 3), dtype=uint8),
    'moviename': Text(shape=(), dtype=string),
    'poselet_hit_idx': Sequence(uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=float32),
    'xcoords': Sequence(float64),
    'ycoords': Sequence(float64),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
إطار موتر تعويم 64
صورة صورة (480 ، 720 ، 3) uint8
اسم الفيلم نص سلسلة
poselet_hit_idx تسلسل (موتر) (لا أحد،) uint16
torsobox ميزة BBox (4 ،) تعويم 32
xcoords تسلسل (موتر) (لا أحد،) تعويم 64
ycoords تسلسل (موتر) (لا أحد،) تعويم 64
@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

فليك / صغير (التكوين الافتراضي)

  • وصف التكوين : يستخدم 5003 أمثلة مستخدمة في ورق CVPR13 MODEC.

  • حجم التحميل : 286.35 MiB

  • الشكل ( tfds.show_examples ):

التصور

فليك / كامل

  • وصف التكوين : يستخدم 20928 مثالاً ، مجموعة شاملة من FLIC تتكون من أمثلة أكثر صعوبة.

  • حجم التحميل : 1.10 GiB

  • الشكل ( tfds.show_examples ):

التصور