此页面由 Cloud Translation API 翻译。
Switch to English

轻弹

  • 说明

摘自本文:我们自动从好莱坞流行电影中收集了5003个图像数据集。这些图像是通过在每30部电影的十分之一帧上运行最先进的人物检测器而获得的。然后,被高度自信地检测到的人(大约2万名候选人)被送到众包市场Amazon Mechanical Turk,以获取地面真实标签。每个图像由五名Turker注释,每个标记$ 0.01,以标记10个上半身关节。在每个图像中采用五个中位数标记,以增强对异常注释的鲁棒性。最后,如果该人被遮挡或严重不正面,图像将被我们手动拒绝。我们预留了20%(1016张图像)的数据进行测试。

分裂例子
'test' 1,016
'train' 3,987
  • 特点
 FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
 
 @inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }
 

flic / small(默认配置)

  • 配置说明 :使用在CVPR13 MODEC论文中使用的5003个示例。

  • 下载大小286.35 MiB

  • 可视化tfds.show_examples ):

可视化

轻/全

  • 配置说明 :使用20928个示例,这是FLIC的超集,其中包含更多困难的示例。

  • 下载大小1.10 GiB

  • 可视化tfds.show_examples ):

可视化