이 페이지는 Cloud Translation API를 통해 번역되었습니다.
Switch to English

플릭

  • 설명 :

논문에서 : 우리는 인기있는 할리우드 영화에서 자동으로 5003 개의 이미지 데이터 세트를 수집했습니다. 이미지는 30 편의 영화의 10 번째 프레임마다 최첨단 사람 감지기를 실행하여 얻었습니다. 높은 신뢰도 (약 20 만 명의 후보자)로 탐지 된 사람들은 크라우드 소싱 마켓 플레이스 인 Amazon Mechanical Turk로 보내져 진실을 알리는 라벨을 얻었습니다. 각각의 이미지에는 10 개의 상체 관절을 표시하기 위해 각각 $ 0.01에 5 개의 Turker가 주석을 달았습니다. 각 이미지에서 5 개 중간 값 레이블링을 사용하여 특이한 주석에 견고했습니다. 마지막으로, 사람이 폐쇄되었거나 심각하지 않은 경우 이미지는 수동으로 거부되었습니다. 테스트 할 데이터의 20 % (1016 개 이미지)를 따로 설정했습니다.

스플릿
'test' 1,016
'train' 3,987
  • 특징 :
 FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
 
 @inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }
 

flic / small (기본 구성)

  • 구성 설명 : CVPR13 MODEC 용지에 사용 된 5003 예제를 사용합니다.

  • 다운로드 크기 : 286.35 MiB

  • 시각화 ( tfds.show_examples ) :

심상

플릭 / 풀

  • 구성 설명 :보다 어려운 예제로 구성된 FLIC의 상위 집합 인 20928 예제를 사용합니다.

  • 다운로드 크기 : 1.10 GiB

  • 시각화 ( tfds.show_examples ) :

심상