Sintonize-se com as primeiras mulheres em ML Simpósio esta terça-feira 19 out às 9h PST Register now

imagenet2012_subset

Imagenet2012Subset é um subconjunto do conjunto de dados ImageNet ILSVRC 2012 original. A participação do conjunto de dados ao mesmo conjunto de validação que o original conjunto de dados IMAGEnet ILSVRC de 2012. No entanto, o conjunto de treinamento é subamostrado de uma forma balanceada de rótulo. Em 1pct configuração, 1%, ou 12811, as imagens são amostrados, a maioria das classes têm o mesmo número de imagens (média de 12,8), algumas classes têm aleatoriamente mais um exemplo do que outros; e em 10pct configuração, ~ 10%, ou 128.116, a maioria das classes têm o mesmo número de imagens (média de 128), e algumas classes têm aleatoriamente mais um exemplo do que outros.

Isto é suposto ser usado como referência para o aprendizado semi-supervisionado, e foi originalmente usado em papel SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Homepage: http://image-net.org/

  • O código-fonte: tfds.image_classification.Imagenet2012Subset

  • versões:

    • 2.0.0 etiquetas de validação CORRECÇÃO:.
    • 2.0.1 : Codificação de correção. Sem alterações do ponto de vista do usuário.
    • 3.0.0 : coloração Fix em ~ 12 imagens (CMYK -> RGB). Corrija o formato para manter a consistência (converta a imagem png única em JPEG). Leitura de geração mais rápida diretamente do arquivo.

    • 4.0.0 : (não publicado)

    • 5.0.0 (padrão): Nova divisão API ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Adicionado divisão teste.

  • Instruções baixar o manual: Este conjunto de dados requer que você baixe os dados de origem manualmente para download_config.manual_dir (o padrão é ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir deve conter dois arquivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Você precisa se registrar no http://www.image-net.org/download-images , a fim de obter o link para baixar o conjunto de dados.

  • Cache-Auto ( documentação ): Não

  • Características:

FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset / 1pct (configuração padrão)

  • A inscrição Config: 1pct do conjunto de treinamento IMAGEnet total.

  • Tamanho do download: 254.22 KiB

  • Tamanho do conjunto de dados: 7.61 GiB

  • desdobramentos:

Dividir Exemplos
'train' 12.811
'validation' 50.000

Visualização

imagenet2012_subset / 10pct

  • A inscrição Config: 10pct do conjunto de treinamento IMAGEnet total.

  • Tamanho do download: 2.48 MiB

  • Tamanho do conjunto de dados: 19.91 GiB

  • desdobramentos:

Dividir Exemplos
'train' 128.116
'validation' 50.000

Visualização