Cette page a été traduite par l'API Cloud Translation.
Switch to English

flic

  • Description :

À partir de l'article: Nous avons collecté automatiquement un ensemble de données d'images 5003 à partir de films hollywoodiens populaires. Les images ont été obtenues en exécutant un détecteur de personne de pointe sur chaque dixième image de 30 films. Les personnes détectées avec une grande confiance (environ 20 000 candidats) ont ensuite été envoyées sur le marché du crowdsourcing Amazon Mechanical Turk pour obtenir un étiquetage de la vérité au sol. Chaque image a été annotée par cinq Turkers pour 0,01 $ chacun pour étiqueter 10 articulations du haut du corps. L'étiquetage médian sur cinq a été pris dans chaque image pour être robuste à l'annotation aberrante. Enfin, les images étaient rejetées manuellement par nous si la personne était occluse ou gravement non frontale. Nous avons mis de côté 20% (1016 images) des données pour les tests.

Divisé Exemples
'test' 1 016
'train' 3 987
  • Caractéristiques :
 FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
 
 @inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }
 

flic / small (configuration par défaut)

  • Description de la configuration : Utilise 5003 exemples utilisés dans le papier CVPR13 MODEC.

  • Taille du téléchargement : 286.35 MiB

  • Visualisation ( tfds.show_examples ):

Visualisation

flic / plein

  • Description de la configuration : utilise 20928 exemples, un sur-ensemble de FLIC constitué d'exemples plus difficiles.

  • Taille du téléchargement : 1.10 GiB

  • Visualisation ( tfds.show_examples ):

Visualisation