Visualizzazione : Esplora in Conosci i tuoi dati
Descrizione :
Imagenet2012Subset è un sottoinsieme del set di dati ImageNet ILSVRC 2012 originale. Il set di dati condivide lo stesso set di convalida del set di dati ImageNet ILSVRC 2012 originale. Tuttavia, il set di addestramento è sottoposto a sottocampionamento in modo bilanciato dall'etichetta. Nella configurazione 1pct
, 1% o 12811, le immagini vengono campionate, la maggior parte delle classi ha lo stesso numero di immagini (media 12,8), alcune classi hanno casualmente 1 esempio in più rispetto ad altre; e nella configurazione 10pct
, ~10% o 128116, la maggior parte delle classi ha lo stesso numero di immagini (in media 128) e alcune classi hanno casualmente 1 esempio in più rispetto ad altre.
Questo dovrebbe essere utilizzato come punto di riferimento per l'apprendimento semi-supervisionato ed è stato originariamente utilizzato nel documento SimCLR ( https://arxiv.org/abs/2002.05709 ).
Pagina iniziale : http://image-net.org/
Codice sorgente :
tfds.datasets.imagenet2012_subset.Builder
Versioni :
-
2.0.0
: correzione delle etichette di convalida. -
2.0.1
: correzione della codifica. Nessuna modifica dal punto di vista dell'utente. 3.0.0
: correzione della colorazione su ~ 12 immagini (CMYK -> RGB). Correggi il formato per coerenza (converti la singola immagine png in Jpeg). Generazione più rapida lettura direttamente dall'archivio.4.0.0
: (non pubblicato)5.0.0
(impostazione predefinita): nuova API divisa ( https://tensorflow.org/datasets/splits )5.1.0
: Aggiunta divisione test.
-
Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in
download_config.manual_dir
(il valore predefinito è~/tensorflow_datasets/downloads/manual/
):
manual_dir dovrebbe contenere due file: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. È necessario registrarsi su https://image-net.org/download-images per ottenere il collegamento per scaricare il set di dati.Cache automatica ( documentazione ): No
Struttura delle caratteristiche :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
nome del file | Testo | corda | ||
Immagine | Immagine | (Nessuno, Nessuno, 3) | uint8 | |
etichetta | ClassLabel | int64 |
Chiavi supervisionate (vedi
as_supervised
doc ):('image', 'label')
Citazione :
@article{chen2020simple,
title={A Simple Framework for Contrastive Learning of Visual Representations},
author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
journal={arXiv preprint arXiv:2002.05709},
year={2020}
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_subset/1pct (configurazione predefinita)
Descrizione della configurazione : 1% del set di formazione totale di ImageNet.
Dimensione del download :
254.22 KiB
Dimensione del set di dati :
7.61 GiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 12.811 |
'validation' | 50.000 |
- Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
imagenet2012_subset/10%
Descrizione della configurazione : 10% del set di formazione totale di ImageNet.
Dimensione del download :
2.48 MiB
Dimensione del set di dati :
19.91 GiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 128,116 |
'validation' | 50.000 |
- Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):