svolazzare

Dal giornale: abbiamo raccolto automaticamente un set di dati di immagini 5003 dai famosi film di Hollywood. Le immagini sono state ottenute eseguendo un rilevatore di persone all'avanguardia su ogni decimo fotogramma di 30 film. Le persone individuate con elevata fiducia (circa 20.000 candidati) sono state quindi inviate al mercato di crowdsourcing Amazon Mechanical Turk per ottenere l'etichettatura della verità. Ogni immagine è stata annotata da cinque Turker per $ 0,01 ciascuno per etichettare 10 articolazioni della parte superiore del corpo. L'etichettatura mediana di cinque è stata presa in ciascuna immagine per essere robusta rispetto all'annotazione anomala. Infine, le immagini sono state rifiutate manualmente da noi se la persona era occlusa o gravemente non frontale. Mettiamo da parte il 20% (1016 immagini) dei dati per i test.

Diviso Esempi
'test' 1.016
'train' 3.987
  • Struttura delle caratteristiche :
FeaturesDict({
    'currframe': float64,
    'image': Image(shape=(480, 720, 3), dtype=uint8),
    'moviename': Text(shape=(), dtype=string),
    'poselet_hit_idx': Sequence(uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=float32),
    'xcoords': Sequence(float64),
    'ycoords': Sequence(float64),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
currframe Tensore galleggiante64
Immagine Immagine (480, 720, 3) uint8
nomefilm Testo corda
poselet_hit_idx Sequenza (tensore) (Nessuno,) uint16
busto Funzionalità BBox (4,) galleggiante32
xcoords Sequenza (tensore) (Nessuno,) galleggiante64
ycoords Sequenza (tensore) (Nessuno,) galleggiante64
@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/small (configurazione predefinita)

  • Descrizione della configurazione : utilizza 5003 esempi utilizzati nel documento CVPR13 MODEC.

  • Dimensione del download : 286.35 MiB

  • Figura ( tfds.show_examples ):

Visualizzazione

flic/pieno

  • Descrizione della configurazione : utilizza 20928 esempi, un superset di FLIC costituito da esempi più difficili.

  • Dimensione del download : 1.10 GiB

  • Figura ( tfds.show_examples ):

Visualizzazione