Trang này được dịch bởi Cloud Translation API.
Switch to English

flic

  • Mô tả :

Từ tờ giấy: Chúng tôi đã thu thập một bộ dữ liệu hình ảnh 5003 tự động từ các bộ phim nổi tiếng của Hollywood. Các hình ảnh thu được bằng cách chạy một máy dò người hiện đại trên mỗi khung hình thứ mười của 30 bộ phim. Những người được phát hiện với độ tin cậy cao (khoảng 20 nghìn ứng viên) sau đó đã được gửi đến thị trường dịch vụ đám đông Amazon Mechanical Turk để có được nhãn hiệu nền tảng. Mỗi hình ảnh được chú thích bởi năm Turker với giá 0,01 đô la mỗi cái để dán nhãn cho 10 khớp trên. Việc ghi nhãn trung bình của năm được chụp trong mỗi hình ảnh để trở nên mạnh mẽ cho chú thích ngoại lệ. Cuối cùng, hình ảnh đã bị chúng tôi từ chối một cách thủ công nếu người đó bị che khuất hoặc không nghiêm túc. Chúng tôi dành 20% (1016 hình ảnh) dữ liệu để thử nghiệm.

Tách Ví dụ
'test' 1.016
'train' 3.987
  • Các tính năng :
 FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
 
 @inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }
 

flic / small (cấu hình mặc định)

  • Mô tả cấu hình : Sử dụng 5003 ví dụ được sử dụng trong bài viết CVPR13 MODEC.

  • Kích thước tải xuống : 286.35 MiB

  • Trực quan hóa ( tfds.show_examples ):

Hình dung

flic / đầy đủ

  • Mô tả cấu hình : Sử dụng 20928 ví dụ, siêu bộ FLIC bao gồm các ví dụ khó hơn.

  • Kích thước tải xuống : 1.10 GiB

  • Trực quan hóa ( tfds.show_examples ):

Hình dung