Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

симметричные_твердые тела

  • Описание:

Это набор данных для оценки позы, состоящий из симметричных трехмерных фигур, в которых несколько ориентаций визуально неразличимы. Задача состоит в том, чтобы предсказать все эквивалентные ориентации, когда только одна ориентация сочетается с каждым изображением во время обучения (как в сценарии для большинства наборов данных оценки позы). В отличие от большинства наборов данных для оценки позы, для оценки доступен полный набор эквивалентных ориентаций.

Всего существует восемь форм, каждая из которых визуализирована из 50 000 точек обзора, равномерно распределенных случайным образом по всему пространству трехмерных вращений. Пять форм безликих - тетраэдр, куб, икосаэдр, конус и цилиндр. Из них три Платоновых тела (тетраэдр, куб, икосаэдр) аннотированы их 12-, 24- и 60-кратными дискретными симметриями соответственно. Конус и цилиндр помечены их непрерывной симметрией, дискретизированной с интервалом в 1 градус. Эти симметрии предназначены для оценки; предполагаемый контроль - это только одно вращение с каждым изображением.

Остальные три формы отмечены отличительным признаком. Есть тетраэдр с одной красной гранью, цилиндр с точкой со смещением от центра и сфера с X, увенчанным точкой. Независимо от того, виден ли отличительный признак, пространство возможных ориентаций сокращается. Мы не предоставляем набор эквивалентных поворотов для этих фигур.

Каждый пример содержит

  • изображение 224x224 RGB
  • индекс формы, чтобы набор данных можно было фильтровать по форме.
    Индексы соответствуют:

    • 0 = тетраэдр
    • 1 = куб
    • 2 = икосаэдр
    • 3 = конус
    • 4 = цилиндр
    • 5 = отмеченный тетраэдр
    • 6 = маркированный цилиндр
    • 7 = отмеченная сфера
  • вращение, используемое в процессе рендеринга, представленное как матрица вращения 3x3

  • набор известных эквивалентных вращений при симметрии для оценки.

В случае трех отмеченных фигур это только поворот рендеринга.

Расколоть Примеры
'test' 40 000
'train' 360 000
  • Особенности:
FeaturesDict({
    'image': Image(shape=(224, 224, 3), dtype=tf.uint8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'rotation': Tensor(shape=(3, 3), dtype=tf.float32),
    'rotations_equivalent': Tensor(shape=(None, 3, 3), dtype=tf.float32),
})

Визуализация

  • Образец цитирования:
@inproceedings{implicitpdf2021,
  title = {Implicit Representation of Probability Distributions on the Rotation
  Manifold},
  author = {Murphy, Kieran and Esteves, Carlos and Jampani, Varun and
  Ramalingam, Srikumar and Makadia, Ameesh}
  booktitle = {International Conference on Machine Learning}
  year = {2021}
}