Questa pagina è stata tradotta dall'API Cloud Translation.
Switch to English

flic

  • Descrizione:

Dalla carta: Abbiamo raccolto una serie di dati immagine 5003 automaticamente da film popolari di Hollywood. Le immagini sono state ottenute eseguendo una persona rivelatore allo stato dell'arte su ogni decimo frame di 30 film. La gente rilevati con elevata sicurezza (circa 20K candidati) sono stati poi inviati al crowdsourcing marketplace Amazon Mechanical Turk di ottenere groundtruthlabeling. Ogni immagine è stata annotata da cinque Turkers per $ 0.01 ogni etichettare 10 articolazioni upperbody. L'etichettatura mediana-di-cinque è stata presa in ogni immagine di essere robusto per l'annotazione dei valori anomali. Infine, le immagini sono state respinte manualmente da noi, se la persona è stata occlusa o gravemente non-frontale. Mettiamo da parte il 20% (1016 immagini) dei dati per il test.

Diviso Esempi
'test' 1.016
'train' 3.987
  • Caratteristiche:
 FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
 
 @inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }
 

flic / piccolo (configurazione di default)

  • Descrizione Config: Usa 5003 esempi utilizzati in carta CVPR13 MODEC.

  • Dimensione del download: 286.35 MiB

  • Visualizzazione ( tfds.show_examples ):

visualizzazione

flic / pieno

  • Descrizione Config: Usi 20928 esempi, un superset di FLIC composta da esempi più difficili.

  • Dimensione del download: 1.10 GiB

  • Visualizzazione ( tfds.show_examples ):

visualizzazione