Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

флик

Из статьи: Мы автоматически собрали набор данных из 5003 изображений из популярных голливудских фильмов. Изображения были получены путем запуска современного детектора лиц на каждом десятом кадре из 30 видеороликов. Люди, обнаруженные с высокой степенью достоверности (примерно 20 тысяч кандидатов), затем были отправлены на краудсорсинговую площадку Amazon Mechanical Turk для получения маркировки достоверности. Каждое изображение было аннотировано пятью туркерами по 0,01 доллара каждый, чтобы пометить 10 суставов верхней части тела. На каждом изображении была взята маркировка по медиане из пяти, чтобы она была устойчивой к аннотации выбросов. Наконец, изображения были отклонены нами вручную, если человек был закрыт или сильно не фронтальный. Мы отложили 20% (1016 изображений) данных для тестирования.

Расколоть Примеры
'test' 1016
'train' 3987
  • Особенности :
FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/small (конфигурация по умолчанию)

  • Описание конфигурации : Использует 5003 примера, использованных в документе CVPR13 MODEC.

  • Размер загрузки : 286.35 MiB

  • Рисунок ( tfds.show_examples ):

Визуализация

флик/полный

  • Описание конфигурации : использует 20928 примеров, надмножество FLIC, состоящее из более сложных примеров.

  • Размер загрузки : 1.10 GiB

  • Рисунок ( tfds.show_examples ):

Визуализация