imagenet_pi

  • Descrizione :

ImageNet-PI è una versione rietichettata del set di dati ImageNet ILSVRC2012 standard in cui le etichette sono fornite da una raccolta di 16 reti neurali profonde con diverse architetture pre-addestrate sullo standard ILSVRC2012. Nello specifico, i modelli pre-addestrati vengono scaricati da tf.keras.applications.

Oltre alle nuove etichette, ImageNet-PI fornisce anche metadati sul processo di annotazione sotto forma di confidenze dei modelli sulle loro etichette e informazioni aggiuntive su ciascun modello.

Per ulteriori informazioni vedere: ImageNet-PI

  • Pagina iniziale : https://github.com/google-research-datasets/imagenet_pi/

  • Codice sorgente : tfds.datasets.imagenet_pi.Builder

  • Versioni :

    • 1.0.0 (impostazione predefinita): versione iniziale.
  • Dimensioni del download : Unknown size

  • Dimensioni del set di dati : Unknown size

  • Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in download_config.manual_dir (il valore predefinito è ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir dovrebbe contenere due file: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. È necessario registrarsi su http://www.image-net.org/download-images per ottenere il collegamento per scaricare il set di dati.

  • Cache automatica ( documentazione ): Sconosciuto

  • Divisioni :

Diviso Esempi
  • Struttura delle caratteristiche :
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
annotator_confidences Tensore (16,) galleggiante32
annotator_labels Tensore (16,) int64
etichetta_pulita ClassLabel int64
nome del file Testo corda
Immagine Immagine (Nessuno, Nessuno, 3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
,

  • Descrizione :

ImageNet-PI è una versione rietichettata del set di dati ImageNet ILSVRC2012 standard in cui le etichette sono fornite da una raccolta di 16 reti neurali profonde con diverse architetture pre-addestrate sullo standard ILSVRC2012. Nello specifico, i modelli pre-addestrati vengono scaricati da tf.keras.applications.

Oltre alle nuove etichette, ImageNet-PI fornisce anche metadati sul processo di annotazione sotto forma di confidenze dei modelli sulle loro etichette e informazioni aggiuntive su ciascun modello.

Per ulteriori informazioni vedere: ImageNet-PI

  • Pagina iniziale : https://github.com/google-research-datasets/imagenet_pi/

  • Codice sorgente : tfds.datasets.imagenet_pi.Builder

  • Versioni :

    • 1.0.0 (impostazione predefinita): versione iniziale.
  • Dimensioni del download : Unknown size

  • Dimensioni del set di dati : Unknown size

  • Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in download_config.manual_dir (il valore predefinito è ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir dovrebbe contenere due file: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. È necessario registrarsi su http://www.image-net.org/download-images per ottenere il collegamento per scaricare il set di dati.

  • Cache automatica ( documentazione ): Sconosciuto

  • Divisioni :

Diviso Esempi
  • Struttura delle caratteristiche :
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
annotator_confidences Tensore (16,) galleggiante32
annotator_labels Tensore (16,) int64
etichetta_pulita ClassLabel int64
nome del file Testo corda
Immagine Immagine (Nessuno, Nessuno, 3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}