Эта страница была переведа с помощью Cloud Translation API.
Switch to English

флик

  • Описание :

Из статьи: Мы автоматически собрали набор данных 5003 изображений из популярных голливудских фильмов. Изображения были получены с помощью современного детектора людей на каждом десятом кадре 30 фильмов. Люди, выявленные с высокой степенью достоверности (примерно 20 тысяч кандидатов), затем были отправлены на рынок краудсорсинга Amazon Mechanical Turk для получения достоверной маркировки. Каждое изображение было аннотировано пятью туркерами по 0,01 доллара за каждый, чтобы отметить 10 суставов верхней части тела. Для каждого изображения была взята маркировка среднего из пяти, чтобы быть устойчивой к аннотации выбросов. Наконец, изображения были отклонены нами вручную, если человек был окклюзией или сильно не лобным. Мы отложили 20% (1016 изображений) данных для тестирования.

Трещина Примеры
'test' 1,016
'train' 3 987
  • Особенности :
FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
  • Контролируемые ключи (см. as_supervised doc ): None

  • Цитата :

@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic / small (конфигурация по умолчанию)

  • Описание конфигурации : используется 5003 примера, использованных в документе CVPR13 MODEC.

  • Размер загрузки : 286.35 MiB

  • Рисунок ( tfds.show_examples ):

Визуализация

фильм / полный

  • Описание конфигурации : Использует 20928 примеров, расширенный набор FLIC, состоящий из более сложных примеров.

  • Размер загружаемого файла : 1.10 GiB

  • Рисунок ( tfds.show_examples ):

Визуализация