imagenet2012_fewshot

  • Descrizione :

Imagenet2012Fewshot è un sottoinsieme del set di dati ImageNet ILSVRC 2012 originale. Il set di dati condivide lo stesso set di convalida del set di dati ImageNet ILSVRC 2012 originale. Tuttavia, il set di addestramento è sottoposto a sottocampionamento in modo bilanciato dall'etichetta. Nella configurazione 5shot , vengono campionate 5 immagini per etichetta o 5000 immagini; e nella configurazione 10shot , vengono campionate 10 immagini per etichetta o 10000 immagini.

  • Pagina iniziale : http://image-net.org/

  • Codice sorgente : tfds.datasets.imagenet2012_fewshot.Builder

  • Versioni :

    • 2.0.0 : correzione delle etichette di convalida.
    • 2.0.1 : correzione della codifica. Nessuna modifica dal punto di vista dell'utente.
    • 3.0.0 : correzione della colorazione su ~ 12 immagini (CMYK -> RGB). Correggi il formato per coerenza (converti la singola immagine png in Jpeg). Generazione più rapida lettura direttamente dall'archivio.

    • 4.0.0 : (non pubblicato)

    • 5.0.0 : Nuova API divisa ( https://tensorflow.org/datasets/splits )

    • 5.0.1 (impostazione predefinita): nessuna nota di rilascio.

    • 5.1.0 : Aggiunta divisione test.

  • Dimensioni del download : Unknown size

  • Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in download_config.manual_dir (il valore predefinito è ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir dovrebbe contenere due file: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. È necessario registrarsi su https://image-net.org/download-images per ottenere il collegamento per scaricare il set di dati.

  • Cache automatica ( documentazione ): No

  • Struttura delle caratteristiche :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
nome del file Testo corda
Immagine Immagine (Nessuno, Nessuno, 3) uint8
etichetta ClassLabel int64
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_fewshot/1shot (configurazione predefinita)

  • Descrizione della configurazione : 1 colpo del set di formazione totale di ImageNet.

  • Dimensione del set di dati : 6.46 GiB

  • Divisioni :

Diviso Esempi
'train' 1.000
'tune' 1.000
'validation' 50.000

Visualizzazione

imagenet2012_fewshot/5shot

  • Descrizione della configurazione : 5 scatti del set di formazione totale di ImageNet.

  • Dimensione del set di dati : 6.88 GiB

  • Divisioni :

Diviso Esempi
'train' 5.000
'tune' 1.000
'validation' 50.000

Visualizzazione

imagenet2012_fewshot/10shot

  • Descrizione della configurazione : 10 colpi del set di formazione totale di ImageNet.

  • Dimensione del set di dati : 7.42 GiB

  • Divisioni :

Diviso Esempi
'train' 10.000
'tune' 1.000
'validation' 50.000

Visualizzazione