flic

Descrizione :

Dal documento: abbiamo raccolto automaticamente un set di dati di 5003 immagini dai famosi film di Hollywood. Le immagini sono state ottenute eseguendo un rilevatore di persone all'avanguardia su ogni decimo fotogramma di 30 film. Le persone rilevate con elevata sicurezza (circa 20.000 candidati) sono state quindi inviate al mercato di crowdsourcing Amazon Mechanical Turk per ottenere l'etichettatura di verità. Ogni immagine è stata annotata da cinque Turker per $ 0,01 ciascuna per etichettare 10 articolazioni della parte superiore del corpo. L'etichettatura mediana di cinque è stata presa in ciascuna immagine per essere robusta rispetto alle annotazioni anomale. Infine, le immagini venivano rifiutate manualmente da noi se la persona era occlusa o gravemente non frontale. Mettiamo da parte il 20% (1016 immagini) dei dati per i test.

Documentazione aggiuntiva : esplora documenti con codice
Home page : https://bensapp.github.io/flic-dataset.html
Codice sorgente : tfds.datasets.flic.Builder
Versioni :
- 2.0.0 (impostazione predefinita): nessuna nota di rilascio.
Dimensione del set di dati : 317.94 MiB
Memorizzazione nella cache automatica ( documentazione ): No
Divide :

Diviso	Esempi
`'test'`	1.016
`'train'`	3.987

Struttura delle caratteristiche :

FeaturesDict({
    'currframe': float64,
    'image': Image(shape=(480, 720, 3), dtype=uint8),
    'moviename': Text(shape=(), dtype=string),
    'poselet_hit_idx': Sequence(uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=float32),
    'xcoords': Sequence(float64),
    'ycoords': Sequence(float64),
})

Documentazione delle funzionalità :

Caratteristica	Classe	Forma	Tipo D
	CaratteristicheDict
currframe	Tensore		float64
Immagine	Immagine	(480, 720, 3)	uint8
nomefilm	Testo		corda
poselet_hit_idx	Sequenza (Tensore)	(Nessuno,)	uint16
torsobox	Funzione BBox	(4,)	float32
xcoords	Sequenza (Tensore)	(Nessuno,)	float64
ycoords	Sequenza (Tensore)	(Nessuno,)	float64

Chiavi supervisionate (vedi il documento as_supervised ): None
Citazione :

@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/small (configurazione predefinita)

Descrizione configurazione : utilizza gli esempi 5003 utilizzati nel documento MODEC CVPR13.
Dimensione download : 286.35 MiB
Figura ( tfds.show_examples ):

Visualizzazione

Esempi ( tfds.as_dataframe ):

flic/pieno

Descrizione configurazione : utilizza 20928 esempi, un superset di FLIC costituito da esempi più difficili.
Dimensione download : 1.10 GiB
Figura ( tfds.show_examples ):

Visualizzazione

Esempi ( tfds.as_dataframe ):

flic Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

flic/small (configurazione predefinita)

flic/pieno

flic