Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

flic

  • Deskripsi :

Dari kertas: Kami mengumpulkan kumpulan data gambar 5003 secara otomatis dari film-film Hollywood populer. Gambar diperoleh dengan menjalankan detektor orang yang canggih pada setiap frame kesepuluh dari 30 film. Orang yang terdeteksi dengan keyakinan tinggi (sekitar 20 ribu kandidat) kemudian dikirim ke pasar crowdsourcing Amazon Mechanical Turk untuk mendapatkan groundtruthlabeling. Setiap gambar diberi anotasi oleh lima orang Turki seharga $ 0,01 masing-masing untuk melabeli 10 sendi tubuh bagian atas. Pemberian label median-dari-lima diambil di setiap gambar agar sesuai dengan anotasi pencilan. Akhirnya, gambar ditolak secara manual oleh kami jika orang tersebut tersumbat atau sangat non-frontal. Kami menyisihkan 20% (1016 gambar) dari data untuk pengujian.

Membagi Contoh
'test' 1.016
'train' 3.987
  • Fitur :
FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic / small (konfigurasi default)

  • Deskripsi konfigurasi : Menggunakan contoh 5003 yang digunakan dalam kertas CVPR13 MODEC.

  • Ukuran unduhan : 286.35 MiB

  • Gambar ( tfds.show_examples ):

Visualisasi

flic / full

  • Deskripsi konfigurasi : Menggunakan 20928 contoh, superset dari FLIC yang terdiri dari contoh yang lebih sulit.

  • Ukuran unduhan : 1.10 GiB

  • Gambar ( tfds.show_examples ):

Visualisasi