dominio_visual_decathlon

  • Descripción :

Contiene los 10 conjuntos de datos utilizados en Visual Domain Decathlon, parte del PASCAL in Detail Workshop Challenge (CVPR 2017). El objetivo de este desafío es resolver simultáneamente diez problemas de clasificación de imágenes representativos de dominios visuales muy diferentes.

Algunos de los conjuntos de datos incluidos aquí también están disponibles como conjuntos de datos separados en TFDS. Sin embargo, tenga en cuenta que las imágenes fueron preprocesadas para Visual Domain Decathlon (redimensionadas isotrópicamente para tener un tamaño más corto de 72 píxeles) y pueden tener diferentes divisiones de entrenamiento/validación/prueba. Aquí usamos los splits oficiales de la competición.

@ONLINE{hakanbilensylvestrerebuffitomasjakab2017,
    author = "Hakan Bilen, Sylvestre Rebuffi, Tomas Jakab",
    title  = "Visual Domain Decathlon",
    year   = "2017",
    url    = "https://www.robots.ox.ac.uk/~vgg/decathlon/"
}

visual_domain_decathlon/aircraft (configuración predeterminada)

  • Descripción de la configuración : Datos basados ​​en "Aviones", con imágenes redimensionadas isotrópicamente para tener un tamaño más corto de 72 píxeles.

  • Tamaño de la descarga : 409.94 MiB

  • Tamaño del conjunto de datos : 20.96 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'test' 3,333
'train' 3,334
'validation' 3,333
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=100),
    'name': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
nombre Texto cuerda

Visualización

dominio_visual_decathlon/cifar100

  • Descripción de la configuración : datos basados ​​en "CIFAR-100", con imágenes redimensionadas isotrópicamente para tener un tamaño más corto de 72 píxeles.

  • Tamaño de la descarga : 409.94 MiB

  • Tamaño del conjunto de datos : 119.43 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'test' 10,000
'train' 40.000
'validation' 10,000
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=100),
    'name': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
nombre Texto cuerda

Visualización

dominio_visual_decathlon/daimlerpedcls

  • Descripción de la configuración : datos basados ​​en la "Clasificación de peatones de Daimler", con imágenes redimensionadas isotrópicamente para tener un tamaño más corto de 72 píxeles.

  • Tamaño de la descarga : 409.94 MiB

  • Tamaño del conjunto de datos : 68.35 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'test' 19,600
'train' 23,520
'validation' 5,880
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'name': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
nombre Texto cuerda

Visualización

dominio_visual_decathlon/dtd

  • Descripción de la configuración : datos basados ​​en "texturas descriptibles", con imágenes redimensionadas isotrópicamente para tener un tamaño más corto de 72 píxeles.

  • Tamaño de la descarga : 409.94 MiB

  • Tamaño del conjunto de datos : 13.30 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'test' 1,880
'train' 1,880
'validation' 1,880
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=47),
    'name': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
nombre Texto cuerda

Visualización

dominio_visual_decathlon/gtsrb

  • Descripción de la configuración : datos basados ​​en "señales de tráfico alemanas", con imágenes redimensionadas isotrópicamente para tener un tamaño más corto de 72 píxeles.

  • Tamaño de la descarga : 409.94 MiB

  • Tamaño del conjunto de datos : 80.58 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'test' 12,630
'train' 31,367
'validation' 7,842
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=43),
    'name': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
nombre Texto cuerda

Visualización

dominio_visual_decathlon/imagenet12

  • Descripción de la configuración : datos basados ​​en "Imagenet", con imágenes redimensionadas isotrópicamente para tener un tamaño más corto de 72 píxeles.

  • Tamaño de descarga : 6.11 GiB

  • Tamaño del conjunto de datos : 5.24 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'test' 48,238
'train' 1,232,167
'validation' 49,000
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'name': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
nombre Texto cuerda

Visualización

dominio_visual_decathlon/omniglot

  • Descripción de la configuración : datos basados ​​en "Omniglot", con imágenes redimensionadas isotrópicamente para tener un tamaño más corto de 72 píxeles.

  • Tamaño de la descarga : 409.94 MiB

  • Tamaño del conjunto de datos : 41.46 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'test' 8,115
'train' 17,853
'validation' 6,492
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1623),
    'name': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
nombre Texto cuerda

Visualización

dominio_visual_decathlon/svhn

  • Descripción de la configuración : datos basados ​​en "Números de casas de Street View", con imágenes redimensionadas isotrópicamente para tener un tamaño más corto de 72 píxeles.

  • Tamaño de la descarga : 409.94 MiB

  • Tamaño del conjunto de datos : 135.32 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'test' 26,032
'train' 47,217
'validation' 26,040
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'name': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
nombre Texto cuerda

Visualización

dominio_visual_decathlon/ucf101

  • Descripción de la configuración : Datos basados ​​en "Imágenes dinámicas UCF101", con imágenes redimensionadas isotrópicamente para tener un tamaño más corto de 72 píxeles.

  • Tamaño de la descarga : 409.94 MiB

  • Tamaño del conjunto de datos : 19.73 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'test' 3,783
'train' 7,585
'validation' 1,952
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=101),
    'name': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
nombre Texto cuerda

Visualización

visual_domain_decathlon/vgg-flores

  • Descripción de la configuración : datos basados ​​en "VGG-Flowers", con imágenes redimensionadas isotrópicamente para tener un tamaño más corto de 72 píxeles.

  • Tamaño de la descarga : 409.94 MiB

  • Tamaño del conjunto de datos : 20.87 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'test' 6,149
'train' 1,020
'validation' 1,020
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=102),
    'name': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
nombre Texto cuerda

Visualización