stanford_dogs

  • Mô tả :

Bộ dữ liệu Stanford Dogs chứa hình ảnh của 120 giống chó từ khắp nơi trên thế giới. Bộ dữ liệu này đã được xây dựng bằng hình ảnh và chú thích từ ImageNet cho nhiệm vụ phân loại hình ảnh chi tiết. Có 20.580 hình ảnh, trong đó 12.000 được sử dụng để đào tạo và 8580 để thử nghiệm. Nhãn lớp và chú thích hộp giới hạn được cung cấp cho tất cả 12.000 hình ảnh.

Tách ra ví dụ
'test' 8.580
'train' 12.000
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=120),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Đặc tính Tầng lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
hình ảnh/tên tập tin Chữ chuỗi
nhãn LớpNhãn int64
các đối tượng Sự liên tiếp
đối tượng/bbox Tính năng BBox (4,) phao32

Hình dung

  • trích dẫn :
@inproceedings{KhoslaYaoJayadevaprakashFeiFei_FGVC2011,
author = "Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and
          Li Fei-Fei",
title = "Novel Dataset for Fine-Grained Image Categorization",
booktitle = "First Workshop on Fine-Grained Visual Categorization,
             IEEE Conference on Computer Vision and Pattern Recognition",
year = "2011",
month = "June",
address = "Colorado Springs, CO",
}
@inproceedings{imagenet_cvpr09,
        AUTHOR = {Deng, J. and Dong, W. and Socher, R. and Li, L.-J. and
                  Li, K. and Fei-Fei, L.},
        TITLE = { {ImageNet: A Large-Scale Hierarchical Image Database} },
        BOOKTITLE = {CVPR09},
        YEAR = {2009},
        BIBSOURCE = "http://www.image-net.org/papers/imagenet_cvpr09.bib"}