imagenet_pi

  • 설명 :

ImageNet-PI는 표준 ILSVRC2012 ImageNet 데이터 세트의 레이블이 재지정된 버전으로, 표준 ILSVRC2012에서 사전 훈련된 다양한 아키텍처가 있는 16개의 심층 신경망 모음에서 레이블을 제공합니다. 특히 사전 훈련된 모델은 tf.keras.applications에서 다운로드됩니다.

새 레이블 외에도 ImageNet-PI는 각 모델에 대한 추가 정보 및 해당 레이블에 대한 모델의 신뢰도 형식으로 주석 프로세스에 대한 메타 데이터를 제공합니다.

자세한 내용은 다음을 참조하십시오. ImageNet-PI

  • 홈페이지 : https://github.com/google-research-datasets/imagenet_pi/

  • 소스 코드 : tfds.datasets.imagenet_pi.Builder

  • 버전 :

    • 1.0.0 (기본값): 최초 릴리스.
  • 다운로드 크기 : Unknown size

  • 데이터세트 크기 : Unknown size

  • 수동 다운로드 지침 : 이 데이터 세트는 원본 데이터를 download_config.manual_dir 에 수동으로 다운로드해야 합니다(기본값은 ~/tensorflow_datasets/downloads/manual/ ).
    manual_dir에는 ILSVRC2012_img_train.tar 및 ILSVRC2012_img_val.tar의 두 파일이 포함되어야 합니다. 데이터 세트를 다운로드할 수 있는 링크를 받으려면 http://www.image-net.org/download-images 에 등록해야 합니다.

  • 자동 캐시됨 ( 문서 ): 알 수 없음

  • 분할 :

나뉘다
  • 기능 구조 :
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
annotator_confidences 텐서 (16,) float32
annotator_labels 텐서 (16,) int64
clean_label 클래스 레이블 int64
파일 이름 텍스트
영상 영상 (없음, 없음, 3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
,

  • 설명 :

ImageNet-PI는 표준 ILSVRC2012 ImageNet 데이터 세트의 레이블이 재지정된 버전으로, 표준 ILSVRC2012에서 사전 훈련된 다양한 아키텍처가 있는 16개의 심층 신경망 모음에서 레이블을 제공합니다. 특히 사전 훈련된 모델은 tf.keras.applications에서 다운로드됩니다.

새 레이블 외에도 ImageNet-PI는 각 모델에 대한 추가 정보 및 해당 레이블에 대한 모델의 신뢰도 형식으로 주석 프로세스에 대한 메타 데이터를 제공합니다.

자세한 내용은 다음을 참조하십시오. ImageNet-PI

  • 홈페이지 : https://github.com/google-research-datasets/imagenet_pi/

  • 소스 코드 : tfds.datasets.imagenet_pi.Builder

  • 버전 :

    • 1.0.0 (기본값): 최초 릴리스.
  • 다운로드 크기 : Unknown size

  • 데이터세트 크기 : Unknown size

  • 수동 다운로드 지침 : 이 데이터 세트는 원본 데이터를 download_config.manual_dir 에 수동으로 다운로드해야 합니다(기본값은 ~/tensorflow_datasets/downloads/manual/ ).
    manual_dir에는 ILSVRC2012_img_train.tar 및 ILSVRC2012_img_val.tar의 두 파일이 포함되어야 합니다. 데이터 세트를 다운로드할 수 있는 링크를 받으려면 http://www.image-net.org/download-images 에 등록해야 합니다.

  • 자동 캐시됨 ( 문서 ): 알 수 없음

  • 분할 :

나뉘다
  • 기능 구조 :
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
annotator_confidences 텐서 (16,) float32
annotator_labels 텐서 (16,) int64
clean_label 클래스 레이블 int64
파일 이름 텍스트
영상 영상 (없음, 없음, 3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}