פליק

מתוך העיתון: אספנו מערך תמונות של 5003 באופן אוטומטי מסרטים הוליוודיים פופולריים. התמונות התקבלו על ידי הפעלת גלאי אדם חדיש על כל פריים עשירי מתוך 30 סרטים. אנשים שזוהו בביטחון רב (בערך 20,000 מועמדים) נשלחו לאחר מכן לשוק מיקור ההמונים Amazon Mechanical Turk כדי להשיג תיוג אמת. כל תמונה סומנה על ידי חמישה טורקים תמורת 0.01 דולר כל אחד כדי לסמן 10 מפרקי פלג גוף עליון. התיוג החציוני מבין חמש צולם בכל תמונה כדי להיות חזק להערות חריגות. לבסוף, תמונות נדחו על ידינו באופן ידני אם האדם היה חסום או לא פרונטלי בצורה חמורה. אנו מפרישים 20% (1016 תמונות) מהנתונים לבדיקה.

לְפַצֵל דוגמאות
'test' 1,016
'train' 3,987
  • מבנה תכונה :
FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
currframe מוֹתֵחַ tf.float64
תמונה תמונה (480, 720, 3) tf.uint8
שם הסרט טֶקסט tf.string
poselet_hit_idx רצף (טנזור) (אף אחד,) tf.uint16
טורסובוקס BBoxFeature (4,) tf.float32
xcoords רצף (טנזור) (אף אחד,) tf.float64
ycoords רצף (טנזור) (אף אחד,) tf.float64
@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/small (תצורת ברירת מחדל)

  • תיאור תצורה : משתמש ב-5003 דוגמאות המשמשות בנייר CVPR13 MODEC.

  • גודל הורדה : 286.35 MiB

פליק/מלא

  • תיאור תצורה : משתמש ב-20928 דוגמאות, ערכת-על של FLIC המורכבת מדוגמאות קשות יותר.

  • גודל הורדה : 1.10 GiB