- Sự miêu tả :
Tập dữ liệu này chứa dữ liệu từ Thử thách các lớp đối tượng trực quan PASCAL, tương ứng với các cuộc thi Phân loại và Phát hiện.
Trong cuộc thi Phân loại, mục tiêu là dự đoán tập hợp nhãn có trong hình ảnh, trong khi trong cuộc thi Phát hiện, mục tiêu là dự đoán hộp giới hạn và nhãn của từng đối tượng riêng lẻ. CẢNH BÁO: Theo tập dữ liệu chính thức, bộ thử nghiệm của VOC2012 không chứa chú thích.
Tài liệu bổ sung : Khám phá trên giấy tờ có mã
Mã nguồn :
tfds.object_detection.Voc
Phiên bản :
-
5.0.0
(mặc định) : Không có ghi chú phát hành.
-
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Cấu trúc tính năng :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_difficult': bool,
'is_truncated': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
hình ảnh | Hình ảnh | (Không, Không, 3) | uint8 | |
hình ảnh/tên tập tin | Chữ | sợi dây | ||
nhãn | Trình tự(ClassLabel) | (Không có,) | int64 | |
nhãn_no_khó khăn | Trình tự(ClassLabel) | (Không có,) | int64 | |
đồ vật | Sự liên tiếp | |||
đối tượng/hộp | Tính năng BBox | (4,) | phao32 | |
đối tượng/is_khó khăn | Tenxơ | bool | ||
đối tượng/is_truncated | Tenxơ | bool | ||
đồ vật/nhãn | Nhãn lớp | int64 | ||
đồ vật/tư thế | Nhãn lớp | int64 |
- Khóa được giám sát (Xem
as_supervised
doc ):None
voc/2007 (cấu hình mặc định)
- Mô tả cấu hình : Tập dữ liệu này chứa dữ liệu từ Thử thách các lớp đối tượng trực quan PASCAL 2007, hay còn gọi là VOC2007.
Tổng cộng có 9963 hình ảnh được bao gồm trong tập dữ liệu này, trong đó mỗi hình ảnh chứa một tập hợp các đối tượng, trong số 20 lớp khác nhau, tạo nên tổng số 24640 đối tượng được chú thích.
Trang chủ : http://host.robots.ox.ac.uk/pascal/VOC/voc2007/
Kích thước tải xuống :
868.85 MiB
Kích thước tập dữ liệu :
837.73 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 4.952 |
'train' | 2.501 |
'validation' | 2.510 |
- Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@misc{pascal-voc-2007,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}
voc/2012
- Mô tả cấu hình : Tập dữ liệu này chứa dữ liệu từ Thử thách các lớp đối tượng trực quan PASCAL 2012, hay còn gọi là VOC2012.
Tổng cộng có 11540 hình ảnh được bao gồm trong tập dữ liệu này, trong đó mỗi hình ảnh chứa một tập hợp các đối tượng, trong số 20 lớp khác nhau, tạo nên tổng số 27450 đối tượng được chú thích.
Trang chủ : http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
Kích thước tải xuống :
3.59 GiB
Kích thước tập dữ liệu :
2.44 GiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 10,991 |
'train' | 5,717 |
'validation' | 5,823 |
- Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@misc{pascal-voc-2012,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}