película

Del periódico: recopilamos automáticamente un conjunto de datos de imágenes 5003 de películas populares de Hollywood. Las imágenes se obtuvieron ejecutando un detector de personas de última generación en cada décimo cuadro de 30 películas. Las personas detectadas con alta confianza (alrededor de 20 000 candidatos) se enviaron al mercado de crowdsourcing Amazon Mechanical Turk para obtener el etiquetado de la verdad. Cada imagen fue anotada por cinco Turkers por $0.01 cada uno para etiquetar 10 articulaciones de la parte superior del cuerpo. El etiquetado de la mediana de cinco se tomó en cada imagen para que fuera robusto a la anotación de valores atípicos. Finalmente, las imágenes fueron rechazadas manualmente por nosotros si la persona estaba ocluida o severamente no frontal. Reservamos el 20 % (1016 imágenes) de los datos para las pruebas.

Separar Ejemplos
'test' 1,016
'train' 3,987
  • Estructura de características :
FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
currframe Tensor tf.float64
imagen Imagen (480, 720, 3) tf.uint8
nombre de pelicula Texto tf.cadena
poselet_hit_idx Secuencia (tensor) (Ninguna,) tf.uint16
caja del torso BBoxCaracterística (4,) tf.float32
xcoords Secuencia (tensor) (Ninguna,) tf.float64
ycoords Secuencia (tensor) (Ninguna,) tf.float64
@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/pequeño (configuración predeterminada)

  • Descripción de la configuración : utiliza 5003 ejemplos utilizados en el documento MODEC CVPR13.

  • Tamaño de la descarga : 286.35 MiB

flic/completo

  • Descripción de la configuración : utiliza 20928 ejemplos, un superconjunto de FLIC que consta de ejemplos más difíciles.

  • Tamaño de descarga : 1.10 GiB