imagenet2012_subset

Imagenet2012Subset은 원본 ImageNet ILSVRC 2012 데이터 세트의 하위 집합입니다. 데이터 세트는 원본 ImageNet ILSVRC 2012 데이터 세트와 동일한 검증 세트를 공유합니다. 그러나 트레이닝 세트는 레이블 균형 방식으로 서브샘플링됩니다. 1pct 구성, 1% 또는 12811에서 이미지가 샘플링되고 대부분의 클래스는 동일한 수의 이미지(평균 12.8)를 가지며 일부 클래스는 임의로 다른 클래스보다 1개 더 많은 예제를 갖습니다. 10pct 구성, ~10% 또는 128116에서 대부분의 클래스는 동일한 수의 이미지(평균 128)를 가지며 일부 클래스는 임의로 다른 클래스보다 1개 더 많은 예제를 갖습니다.

이것은 semi-supervised learning을 위한 벤치마크로 사용되어야 하며 원래 SimCLR 논문( https://arxiv.org/abs/2002.05709 )에서 사용되었습니다.

  • 홈페이지 : http://image-net.org/

  • 소스 코드 : tfds.datasets.imagenet2012_subset.Builder

  • 버전 :

    • 2.0.0 : 유효성 검사 레이블을 수정합니다.
    • 2.0.1 : 인코딩 수정. 사용자 관점에서 변경 사항이 없습니다.
    • 3.0.0 : ~12개 이미지의 색상화 수정(CMYK -> RGB). 일관성을 위해 형식을 수정합니다(단일 png 이미지를 Jpeg로 변환). 아카이브에서 직접 읽기 속도가 빨라집니다.

    • 4.0.0 : (미공개)

    • 5.0.0 (기본값): 새로운 분할 API( https://tensorflow.org/datasets/splits )

    • 5.1.0 : 테스트 분할이 추가되었습니다.

  • 수동 다운로드 지침 : 이 데이터 세트는 원본 데이터를 download_config.manual_dir 에 수동으로 다운로드해야 합니다(기본값은 ~/tensorflow_datasets/downloads/manual/ ).
    manual_dir에는 ILSVRC2012_img_train.tar 및 ILSVRC2012_img_val.tar의 두 파일이 포함되어야 합니다. 데이터 세트를 다운로드할 수 있는 링크를 얻으려면 https://image-net.org/download-images 에 등록해야 합니다.

  • 자동 캐시 ( 문서 ): 아니요

  • 기능 구조 :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
파일 이름 텍스트
영상 영상 (없음, 없음, 3) uint8
상표 클래스 레이블 int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct(기본 구성)

  • 구성 설명 : 총 ImageNet 학습 세트의 1pct.

  • 다운로드 크기 : 254.22 KiB

  • 데이터세트 크기 : 7.61 GiB

  • 분할 :

나뉘다
'train' 12,811
'validation' 50,000

심상

imagenet2012_subset/10pct

  • 구성 설명 : 총 ImageNet 학습 세트의 10pct.

  • 다운로드 크기 : 2.48 MiB

  • 데이터세트 크기 : 19.91 GiB

  • 분할 :

나뉘다
'train' 128,116
'validation' 50,000

심상