flic

Z artykułu: Automatycznie zebraliśmy zestaw danych obrazu 5003 z popularnych hollywoodzkich filmów. Obrazy uzyskano, uruchamiając najnowocześniejszy detektor osób na co dziesiątej klatce z 30 filmów. Osoby wykryte z dużą pewnością (około 20 000 kandydatów) zostały następnie wysłane na rynek crowdsourcingowy Amazon Mechanical Turk w celu uzyskania gruntownego oznakowania. Każdy obraz został opatrzony adnotacjami pięciu Turkerów po 0,01 USD każdy, aby oznaczyć 10 stawów górnej części ciała. Mediana z pięciu oznaczeń została wzięta na każdym obrazie, aby była odporna na adnotacje odstające. Ostatecznie obrazy zostały przez nas odrzucone ręcznie, jeśli dana osoba była zatkana lub znacznie nie czołowa. Odłożyliśmy 20% (1016 obrazów) danych do testów.

Rozdzielać Przykłady
'test' 1016
'train' 3987
  • Struktura funkcji :
FeaturesDict({
    'currframe': float64,
    'image': Image(shape=(480, 720, 3), dtype=uint8),
    'moviename': Text(shape=(), dtype=string),
    'poselet_hit_idx': Sequence(uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=float32),
    'xcoords': Sequence(float64),
    'ycoords': Sequence(float64),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
obramowanie Napinacz pływak64
obraz Obraz (480, 720, 3) uint8
nazwa filmu Tekst strunowy
poselet_hit_idx Sekwencja (Tensor) (Nic,) uint16
torsobox Funkcja BBox (4,) pływak32
xwspółrzędne Sekwencja (Tensor) (Nic,) pływak64
współrzędne Sekwencja (Tensor) (Nic,) pływak64
@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/small (domyślna konfiguracja)

  • Opis konfiguracji: Używa 5003 przykładów użytych w dokumencie CVPR13 MODEC.

  • Rozmiar pliku do pobrania : 286.35 MiB

  • Rysunek ( tfds.show_examples ):

Wyobrażanie sobie

szybki/pełny

  • Opis konfiguracji: wykorzystuje 20928 przykładów, nadzbiór FLIC składający się z trudniejszych przykładów.

  • Rozmiar pliku do pobrania : 1.10 GiB

  • Rysunek ( tfds.show_examples ):

Wyobrażanie sobie