shape3d

3dshapesは、6つのグラウンドトゥルースに依存しない潜在因子から手続き的に生成された3D形状のデータセットです。これらの要因は、床の色壁の色オブジェクトの色スケール形状および配向です。

これらの潜在性のすべての可能な組み合わせは、1回だけ存在し、N = 480000の合計画像を生成します。

潜在因子値

  • 床の色相:[0、1]で直線的に配置された10個の値
  • 壁の色相:[0、1]で直線的に配置された10個の値
  • オブジェクトの色相:[0、1]で直線的に配置された10個の値
  • スケール:[0、1]で直線的に配置された8つの値
  • 形状:[0、1、2、3]の4つの値
  • 方向:[-30、30]で直線的に配置された15個の値

我々は時間(向き、次いで形状などから開始)に一つの潜在が変化し、順次に固定された順に画像を記憶されたimagesアレイ。要素の対応する値は、同じ順序で格納されているlabelsアレイ。

スプリット
'train' 480,000
  • 特長
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=tf.uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'value_floor_hue': tf.float32,
    'value_object_hue': tf.float32,
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_wall_hue': tf.float32,
})

視覚化

  • 引用
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}