Ta strona została przetłumaczona przez Cloud Translation API.
Switch to English

flic

  • Opis :

Z artykułu: Zebraliśmy zestaw danych obrazu 5003 automatycznie z popularnych filmów z Hollywood. Obrazy uzyskano, uruchamiając najnowocześniejszy detektor osób na co dziesiątej klatce z 30 filmów. Osoby wykryte z dużą pewnością (około 20 000 kandydatów) były następnie wysyłane na rynek crowdsourcingowy Amazon Mechanical Turk w celu uzyskania naziemnego oznakowania. Każdy obraz został opatrzony adnotacją przez pięciu Turkerów po 0,01 dolara każdy, co oznaczało 10 stawów górnej części ciała. W każdym obrazie pobrano medianę pięciu oznaczeń, aby były odporne na adnotacje odstające. Wreszcie, obrazy były przez nas odrzucane ręcznie, jeśli dana osoba była niedrożna lub w znacznym stopniu nie z przodu. Do testów przeznaczyliśmy 20% (1016 obrazów) danych.

Rozdzielać Przykłady
'test' 1,016
'train' 3,987
  • Cechy :
 FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
 
 @inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }
 

flic / small (domyślna konfiguracja)

  • Opis konfiguracji: wykorzystuje przykłady 5003 używane w papierze CVPR13 MODEC.

  • Rozmiar 286.35 MiB pobrania : 286.35 MiB

  • Wizualizacja ( tfds.show_examples ):

Wyobrażanie sobie

flic / full

  • Opis konfiguracji: wykorzystuje 20928 przykładów, nadzbiór FLIC składający się z trudniejszych przykładów.

  • Rozmiar 1.10 GiB pobrania : 1.10 GiB

  • Wizualizacja ( tfds.show_examples ):

Wyobrażanie sobie