این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

تلنگر

  • توضیحات :

از مقاله: ما مجموعه ای از مجموعه تصاویر 5003 را به طور خودکار از فیلم های محبوب هالیوود جمع آوری کردیم. تصاویر با اجرای یک ردیاب پیشرفته ترین فرد در هر دهمین قاب از 30 فیلم به دست آمد. افراد با اعتماد به نفس بالا (تقریباً 20 کاندیدای نامزد) پس از آن به بازار جمعی که در آمازون مکانیک تورک شرکت می کردند برای یافتن اصطلاحات واقعی به اعزام شدند. هر تصویر توسط پنج ترکر به قیمت ۰ 0.01 ۰ 0.01 ۰ $ 0.01 دلار برای نشان دادن 10 اتصالات بالای شخص حاشیه نویسی شد. در هر تصویر از برچسب متوسط ​​از پنج گرفته شد تا قوی باشد تا حاشیه نویسی متفاوت باشد. سرانجام ، در صورت انسداد بودن فرد یا به شدت غیرقابل جابجایی ، تصاویر به صورت دستی رد می شدند. ما 20٪ (1016 تصویر) داده ها را برای آزمایش کنار گذاشته ایم.

شکاف مثال ها
'test' 1،016
'train' 3،987
  • ویژگی ها :
 FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
 
 @inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }
 

flic / small (پیکربندی پیش فرض)

  • توضیحات پیکربندی : از 5003 نمونه استفاده شده در مقاله CVPR13 MODEC استفاده می کند.

  • اندازه 286.35 MiB : 286.35 MiB

  • تجسم ( tfds.show_examples ):

تجسم

تلنگر / کامل

  • توضیحات پیکربندی : از 20928 نمونه استفاده می کند ، یک Superset از FLIC که از نمونه های دشوار تری برخوردار است.

  • اندازه بارگیری : 1.10 GiB

  • تجسم ( tfds.show_examples ):

تجسم