모양3d

3dshapes는 6개의 실측 독립 잠재 요인에서 절차적으로 생성된 3D 모양의 데이터 세트입니다. 이러한 요소는 바닥 색상 , 벽 색상 , 개체 색상 , 크기 , 모양방향 입니다.

이러한 잠재성의 모든 가능한 조합은 정확히 한 번만 존재하며 N = 480000개의 총 이미지를 생성합니다.

잠재 요인 값

  • 바닥 색조: [0, 1]에서 선형 간격으로 10개 값
  • 벽 색조: [0, 1]에서 선형 간격의 10개 값
  • 개체 색조: [0, 1]에서 선형 간격으로 10개 값
  • 척도: [0, 1]에서 선형 간격으로 8개 값
  • 모양: [0, 1, 2, 3]의 4개 값
  • 오리엔테이션: [-30, 30]으로 선형 간격을 둔 15개 값

우리는 한 번에 하나의 잠재성을 변경하고(방향, 모양 등에서 시작하여) images 배열에 고정된 순서로 이미지를 순차적으로 저장했습니다. 요소의 해당 값은 labels 배열에 동일한 순서로 저장됩니다.

나뉘다
'train' 480,000
  • 기능 구조 :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
영상 영상 (64, 64, 3) uint8
label_floor_hue 클래스 레이블 int64
label_object_hue 클래스 레이블 int64
label_orientation 클래스 레이블 int64
label_scale 클래스 레이블 int64
label_shape 클래스 레이블 int64
label_wall_hue 클래스 레이블 int64
value_floor_hue 텐서 float32
value_object_hue 텐서 float32
value_orientation 텐서 float32
가치 척도 텐서 float32
value_shape 텐서 float32
value_wall_hue 텐서 float32

심상

  • 인용 :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}