Esta página foi traduzida pela API Cloud Translation.
Switch to English

flic

  • Descrição :

Do artigo: coletamos um conjunto de dados de imagens 5003 automaticamente de filmes populares de Hollywood. As imagens foram obtidas executando um detector de pessoa de última geração em cada décimo quadro de 30 filmes. As pessoas detectadas com alta confiança (cerca de 20 mil candidatos) foram então enviadas ao mercado de crowdsourcing Amazon Mechanical Turk para obter a identificação da verdade. Cada imagem foi anotada por cinco Turkers por US $ 0,01 cada, para rotular 10 juntas da parte superior do corpo. A marcação da mediana de cinco foi obtida em cada imagem para ser robusta à anotação externa. Finalmente, as imagens foram rejeitadas manualmente por nós se a pessoa estava ocluída ou severamente não frontal. Reservamos 20% (1016 imagens) dos dados para teste.

Dividido Exemplos
'test' 1.016
'train' 3.987
  • Características :
 FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
 
 @inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }
 

flic / small (configuração padrão)

  • Descrição da configuração : usa 5003 exemplos usados ​​no papel CVPR13 MODEC.

  • Tamanho do download : 286.35 MiB

  • Visualização ( tfds.show_examples ):

Visualização

flic / full

  • Descrição da configuração : usa 20928 exemplos, um superconjunto de FLIC que consiste em exemplos mais difíceis.

  • Tamanho do download : 1.10 GiB

  • Visualização ( tfds.show_examples ):

Visualização