cifar10_1

CIFAR-10.1 데이터 세트는 CIFAR-10에 대한 새로운 테스트 세트입니다. CIFAR-10.1에는 원본 CIFAR-10 데이터 세트에 대한 수년간의 연구 끝에 샘플링된 약 2,000개의 새로운 테스트 이미지가 포함되어 있습니다. CIFAR-10.1의 데이터 수집은 원래 데이터 세트에 비해 분포 이동을 최소화하도록 설계되었습니다. "Do CIFAR-10 Classifiers Generalize to CIFAR-10?" 논문에서 CIFAR-10.1 생성에 대해 설명합니다. CIFAR-10.1의 이미지는 TinyImages 데이터 세트의 하위 집합입니다. 현재 CIFAR-10.1 데이터 세트에는 v4와 v6의 두 가지 버전이 있습니다.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
영상 영상 (32, 32, 3) uint8
상표 클래스 레이블 int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4(기본 구성)

  • 구성 설명 : 분류기를 테스트한 데이터 세트의 첫 번째 버전입니다. 위에서 언급했듯이 이것은 v4 데이터 세트를 우리가 평가하는 분류자와 독립적으로 만듭니다. 우리 백서의 주요 섹션에 보고된 숫자는 이 버전의 데이터 세트를 사용합니다. 각 클래스의 상위 25개 TinyImages 키워드로 구성되어 약간의 클래스 불균형이 발생했습니다. 가장 큰 차이점은 선박이 테스트 세트의 10%가 아닌 8%만 구성한다는 것입니다. v4에는 2,021개의 이미지가 포함되어 있습니다.

  • 다운로드 크기 : 5.93 MiB

  • 데이터 세트 크기 : 4.46 MiB

  • 분할 :

나뉘다
'test' 2,021

심상

cifar10_1/v6

  • 구성 설명 : 정확히 클래스 균형을 이루는 약간 개선된 키워드 할당에서 파생됩니다. 이 버전의 데이터 세트는 우리 논문 부록 D의 결과에 해당합니다. v6에는 2,000개의 이미지가 포함되어 있습니다.

  • 다운로드 크기 : 5.87 MiB

  • 데이터 세트 크기 : 4.40 MiB

  • 분할 :

나뉘다
'test' 2,000

심상