oxford_iiit_pet

Bộ dữ liệu vật nuôi Oxford-IIIT là bộ dữ liệu hình ảnh vật nuôi gồm 37 danh mục với khoảng 200 hình ảnh cho mỗi loại. Các hình ảnh có sự khác biệt lớn về tỷ lệ, tư thế và ánh sáng. Tất cả các hình ảnh có một chú thích sự thật cơ bản liên quan của giống.

Tách ra ví dụ
'test' 3,669
'train' 3.680
  • Cấu trúc tính năng :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
    'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
tên_tệp Chữ chuỗi
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64
phân đoạn_mask Hình ảnh (Không có, Không có, 1) uint8
loài LớpNhãn int64
  • trích dẫn :
@InProceedings{parkhi12a,
  author       = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
  title        = "Cats and Dogs",
  booktitle    = "IEEE Conference on Computer Vision and Pattern Recognition",
  year         = "2012",
}