Se usó la API de Cloud Translation para traducir esta página.
Switch to English

flic

  • Descripción :

Del documento: Recopilamos un conjunto de datos de imagen 5003 automáticamente de películas populares de Hollywood. Las imágenes se obtuvieron ejecutando un detector de personas de última generación en cada décimo cuadro de 30 películas. Las personas detectadas con alta confianza (aproximadamente 20K candidatos) fueron enviadas al mercado de crowdsourcing Amazon Mechanical Turk para obtener un etiquetado real. Cada imagen fue anotada por cinco Turkers por $ 0.01 cada uno para etiquetar 10 articulaciones de la parte superior del cuerpo. La mediana de cinco etiquetas se tomó en cada imagen para ser robusta a las anotaciones atípicas. Finalmente, las imágenes fueron rechazadas manualmente por nosotros si la persona estaba ocluida o severamente no frontal. Reservamos el 20% (1016 imágenes) de los datos para la prueba.

División Ejemplos
'test' 1,016
'train' 3,987
  • Caracteristicas :
 FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
 
 @inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }
 

flic / small (configuración predeterminada)

  • Descripción de la configuración : utiliza 5003 ejemplos utilizados en papel CVPR13 MODEC.

  • Tamaño del 286.35 MiB : 286.35 MiB

  • Visualización ( tfds.show_examples ):

Visualización

flic / full

  • Descripción de la configuración : utiliza 20928 ejemplos, un superconjunto de FLIC que consta de ejemplos más difíciles.

  • Tamaño de descarga : 1.10 GiB

  • Visualización ( tfds.show_examples ):

Visualización