imagenet_r

ImageNet-R là một tập hợp các hình ảnh được gắn nhãn ImageNet thu được bằng cách sưu tập nghệ thuật, phim hoạt hình, deviantart, graffiti, thêu, đồ họa, origami, tranh vẽ, hoa văn, đồ vật bằng nhựa, đồ vật sang trọng, tác phẩm điêu khắc, bản phác thảo, hình xăm, đồ chơi và phiên bản trò chơi điện tử của các lớp ImageNet. ImageNet-R có các phiên bản của 200 lớp ImageNet dẫn đến 30.000 hình ảnh. bằng cách thu thập dữ liệu mới và chỉ giữ lại những hình ảnh mà mô hình ResNet-50 không thể phân loại chính xác. Để biết thêm chi tiết xin vui lòng tham khảo bài viết.

Không gian nhãn giống như của ImageNet2012. Mỗi ví dụ được biểu diễn dưới dạng từ điển với các khóa sau:

  • 'hình ảnh': Hình ảnh, một (H, W, 3)-tensor.
  • 'nhãn': Một số nguyên trong phạm vi [0, 1000).
  • 'file_name': Một dấu hiệu duy nhất xác định ví dụ trong tập dữ liệu.

  • Tài liệu bổ sung : Khám phá trên giấy tờ với mã

  • Trang chủ : https://github.com/hendrycks/imagenet-r

  • Mã nguồn : tfds.datasets.imagenet_r.Builder

  • Phiên bản :

    • 0.1.0 : Không có ghi chú phát hành.
    • 0.2.0 (mặc định): Sửa file_name, từ đường dẫn tuyệt đối thành đường dẫn liên quan đến thư mục imagenet-r, tức là: "imagenet_synset_id/filename.jpg".
  • Kích thước tải xuống : 2.04 GiB

  • Kích thước tập dữ liệu : 2.02 GiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'test' 30.000
  • Cấu trúc tính năng :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tên_tệp Chữ sợi dây
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64

Hình dung

  • trích dẫn :
@article{hendrycks2020many,
  title={The Many Faces of Robustness: A Critical Analysis of Out-of-Distribution Generalization},
  author={Dan Hendrycks and Steven Basart and Norman Mu and Saurav Kadavath and Frank Wang and Evan Dorundo and Rahul Desai and Tyler Zhu and Samyak Parajuli and Mike Guo and Dawn Song and Jacob Steinhardt and Justin Gilmer},
  journal={arXiv preprint arXiv:2006.16241},
  year={2020}
}