imagenet_lt

Descripción :

ImageNet-LT es un subconjunto del conjunto de datos original de ImageNet ILSVRC 2012. El conjunto de entrenamiento se submuestrea de manera que el número de imágenes por clase sigue una distribución de cola larga. La clase con el número máximo de imágenes contiene 1280 ejemplos, mientras que la clase con el número mínimo de imágenes contiene solo 5 ejemplos. El conjunto de datos también tiene un conjunto de validación balanceado, que también es un subconjunto del conjunto de entrenamiento ImageNet ILSVRC 2012 y contiene 20 imágenes por clase. El conjunto de prueba de este conjunto de datos es el mismo que el conjunto de validación del conjunto de datos original de ImageNet ILSVRC 2012.

El conjunto de datos original de ImageNet ILSVRC 2012 debe descargarse manualmente y su ruta debe configurarse con --manual_dir para generar este conjunto de datos.

Documentación adicional : Explore en Papers With Code
Página de inicio : https://github.com/zhmiao/OpenLongTailRecognition-OLTR
Código fuente : tfds.datasets.imagenet_lt.Builder
Versiones :
- 1.0.0 (predeterminado): versión inicial.
Tamaño de la descarga : 5.21 MiB
Tamaño del conjunto de datos : 20.92 GiB
Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en download_config.manual_dir (el valor predeterminado es ~/tensorflow_datasets/downloads/manual/ ):
manual_dir debe contener dos archivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Debe registrarse en http://www.image-net.org/download-images para obtener el enlace para descargar el conjunto de datos.
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'test'`	50,000
`'train'`	115,846
`'validation'`	20,000

Estructura de características :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
Nombre del archivo	Texto		cuerda
imagen	Imagen	(Ninguno, Ninguno, 3)	uint8
etiqueta	Etiqueta de clase		int64

Claves supervisadas (Ver como_documento as_supervised ): ('image', 'label')
Figura ( tfds.show_examples ):

Visualización

Ejemplos ( tfds.as_dataframe ):

Cita :

\
@inproceedings{openlongtailrecognition,
  title={Large-Scale Long-Tailed Recognition in an Open World},
  author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
  booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2019},
  url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}

imagenet_lt Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

imagenet_lt