Visualizzazione : Esplora in Conosci i tuoi dati
Descrizione :
Dal giornale: abbiamo raccolto automaticamente un set di dati di immagini 5003 dai famosi film di Hollywood. Le immagini sono state ottenute eseguendo un rilevatore di persone all'avanguardia su ogni decimo fotogramma di 30 film. Le persone individuate con elevata fiducia (circa 20.000 candidati) sono state quindi inviate al mercato di crowdsourcing Amazon Mechanical Turk per ottenere l'etichettatura della verità. Ogni immagine è stata annotata da cinque Turker per $ 0,01 ciascuno per etichettare 10 articolazioni della parte superiore del corpo. L'etichettatura mediana di cinque è stata presa in ciascuna immagine per essere robusta rispetto all'annotazione anomala. Infine, le immagini sono state rifiutate manualmente da noi se la persona era occlusa o gravemente non frontale. Mettiamo da parte il 20% (1016 immagini) dei dati per i test.
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://bensapp.github.io/flic-dataset.html
Codice sorgente :
tfds.datasets.flic.Builder
Versioni :
-
2.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del set di dati:
317.94 MiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'test' | 1.016 |
'train' | 3.987 |
- Struttura delle caratteristiche :
FeaturesDict({
'currframe': float64,
'image': Image(shape=(480, 720, 3), dtype=uint8),
'moviename': Text(shape=(), dtype=string),
'poselet_hit_idx': Sequence(uint16),
'torsobox': BBoxFeature(shape=(4,), dtype=float32),
'xcoords': Sequence(float64),
'ycoords': Sequence(float64),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
currframe | Tensore | galleggiante64 | ||
Immagine | Immagine | (480, 720, 3) | uint8 | |
nomefilm | Testo | corda | ||
poselet_hit_idx | Sequenza (tensore) | (Nessuno,) | uint16 | |
busto | Funzionalità BBox | (4,) | galleggiante32 | |
xcoords | Sequenza (tensore) | (Nessuno,) | galleggiante64 | |
ycoords | Sequenza (tensore) | (Nessuno,) | galleggiante64 |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Citazione :
@inproceedings{modec13,
title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
author={Sapp, Benjamin and Taskar, Ben},
booktitle={In Proc. CVPR},
year={2013},
}
flic/small (configurazione predefinita)
Descrizione della configurazione : utilizza 5003 esempi utilizzati nel documento CVPR13 MODEC.
Dimensione del download :
286.35 MiB
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
flic/pieno
Descrizione della configurazione : utilizza 20928 esempi, un superset di FLIC costituito da esempi più difficili.
Dimensione del download :
1.10 GiB
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):