imagenet2012_subset

  • Sự miêu tả :

Imagenet2012Subset là tập hợp con của tập dữ liệu ImageNet ILSVRC 2012 gốc. Tập dữ liệu chia sẻ cùng một bộ xác thực như tập dữ liệu ImageNet ILSVRC 2012 ban đầu. Tuy nhiên, tập huấn luyện được lấy mẫu con theo kiểu cân bằng nhãn. Trong cấu hình 1pct , 1% hoặc 12811, hình ảnh được lấy mẫu, hầu hết các lớp có cùng số lượng hình ảnh (trung bình 12,8), một số lớp ngẫu nhiên có nhiều hơn 1 ví dụ so với các lớp khác; và trong cấu hình 10pct , ~10% hoặc 128116, hầu hết các lớp đều có cùng số lượng hình ảnh (trung bình 128) và một số lớp ngẫu nhiên có nhiều hơn 1 ví dụ so với các lớp khác.

Điều này được cho là sẽ được sử dụng làm điểm chuẩn cho việc học bán giám sát và ban đầu được sử dụng trong bài báo SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Trang chủ : http://image-net.org/

  • Mã nguồn : tfds.datasets.imagenet2012_subset.Builder

  • Phiên bản :

    • 2.0.0 : Sửa nhãn xác thực.
    • 2.0.1 : Sửa lỗi mã hóa. Không có thay đổi từ quan điểm của người dùng.
    • 3.0.0 : Sửa lỗi màu trên ~12 hình ảnh (CMYK -> RGB). Sửa định dạng để đảm bảo tính nhất quán (chuyển đổi hình ảnh png đơn sang Jpeg). Đọc thế hệ nhanh hơn trực tiếp từ kho lưu trữ.

    • 4.0.0 : (chưa xuất bản)

    • 5.0.0 (mặc định): API phân chia mới ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Đã thêm phần chia thử nghiệm.

  • Hướng dẫn tải xuống thủ công : Tập dữ liệu này yêu cầu bạn tải xuống dữ liệu nguồn theo cách thủ công vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir phải chứa hai tệp: ILSVRC2012_img_train.tar và ILSVRC2012_img_val.tar. Bạn cần đăng ký trên https://image-net.org/download-images để nhận liên kết tải xuống tập dữ liệu.

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Cấu trúc tính năng :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
tên_tệp Chữ sợi dây
hình ảnh Hình ảnh (Không, Không, 3) uint8
nhãn Nhãn lớp int64
  • Khóa được giám sát (Xem as_supervised doc ): ('image', 'label')

  • Trích dẫn :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (cấu hình mặc định)

  • Mô tả cấu hình : 1% trong tổng số tập huấn luyện ImageNet.

  • Kích thước tải xuống : 254.22 KiB

  • Kích thước tập dữ liệu : 7.61 GiB

  • Chia tách :

Tách ra Ví dụ
'train' 12.811
'validation' 50.000

Hình dung

imagenet2012_subset/10pct

  • Mô tả cấu hình : 10% trong tổng số tập huấn luyện ImageNet.

  • Kích thước tải xuống : 2.48 MiB

  • Kích thước tập dữ liệu : 19.91 GiB

  • Chia tách :

Tách ra Ví dụ
'train' 128.116
'validation' 50.000

Hình dung