oxford_iiit_pet

  • Sự miêu tả :

Bộ dữ liệu thú cưng Oxford-IIIT là bộ dữ liệu hình ảnh thú cưng gồm 37 loại với khoảng 200 hình ảnh cho mỗi lớp. Các hình ảnh có sự khác biệt lớn về tỷ lệ, tư thế và ánh sáng. Tất cả các hình ảnh đều có chú thích cơ bản liên quan đến giống.

Tách ra Ví dụ
'test' 3.669
'train' 3.680
  • Cấu trúc tính năng :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
    'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
tên_tệp Chữ sợi dây
hình ảnh Hình ảnh (Không, Không, 3) uint8
nhãn Nhãn lớp int64
phân khúc_mask Hình ảnh (Không có, Không có, 1) uint8
giống loài Nhãn lớp int64
  • Trích dẫn :
@InProceedings{parkhi12a,
  author       = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
  title        = "Cats and Dogs",
  booktitle    = "IEEE Conference on Computer Vision and Pattern Recognition",
  year         = "2012",
}