Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

flic

  • Deskripsi :

Dari kertas: Kami mengumpulkan dataset gambar 5003 secara otomatis dari film-film Hollywood populer. Gambar diperoleh dengan menjalankan detektor orang yang canggih pada setiap frame kesepuluh dari 30 film. Orang-orang yang terdeteksi dengan keyakinan tinggi (kira-kira 20 ribu kandidat) kemudian dikirim ke pasar crowdsourcing Amazon Mechanical Turk untuk mendapatkan groundtruthlabeling. Setiap gambar dianotasi oleh lima orang Turk seharga $ 0,01 masing-masing untuk label 10 sendi tubuh bagian atas. Pelabelan median-lima diambil pada setiap gambar agar kuat untuk anotasi outlier. Akhirnya, gambar ditolak secara manual oleh kami jika orang itu tersumbat atau sangat non-frontal. Kami menyisihkan 20% (1016 gambar) dari data untuk pengujian.

Membagi Contohnya
'test' 1,016
'train' 3,987
  • Fitur :
 FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
 
 @inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }
 

flic / small (konfigurasi default)

  • Deskripsi konfigurasi : Menggunakan 5003 contoh yang digunakan dalam kertas MODPR CVPR13.

  • Ukuran unduhan : 286.35 MiB

  • Visualisasi ( tfds.show_examples ):

Visualisasi

flic / penuh

  • Keterangan konfigurasi : Menggunakan 20928 contoh, superset dari FLIC yang terdiri dari contoh yang lebih sulit.

  • Ukuran unduhan : 1.10 GiB

  • Visualisasi ( tfds.show_examples ):

Visualisasi