visual_domain_decathlon

  • Mô tả :

Phần này chứa 10 bộ dữ liệu được sử dụng trong Visual Domain Decathlon, một phần của PASCAL trong Thử thách hội thảo chi tiết (CVPR 2017). Mục tiêu của thử thách này là giải quyết đồng thời mười vấn đề phân loại hình ảnh đại diện cho các miền hình ảnh rất khác nhau.

Một số bộ dữ liệu bao gồm ở đây cũng có sẵn dưới dạng các bộ dữ liệu riêng biệt trong TFDS. Tuy nhiên, hãy lưu ý rằng các hình ảnh đã được xử lý trước cho Visual Domain Decathlon (đã thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel) và có thể có các phân tách đào tạo/xác thực/thử nghiệm khác nhau. Ở đây chúng tôi sử dụng cách chia chính thức cho cuộc thi.

@ONLINE{hakanbilensylvestrerebuffitomasjakab2017,
    author = "Hakan Bilen, Sylvestre Rebuffi, Tomas Jakab",
    title  = "Visual Domain Decathlon",
    year   = "2017",
    url    = "https://www.robots.ox.ac.uk/~vgg/decathlon/"
}

visual_domain_decathlon/máy bay (cấu hình mặc định)

  • Mô tả cấu hình : Dữ liệu dựa trên "Máy bay", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 20.96 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'test' 3,333
'train' 3,334
'validation' 3,333
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=100),
    'name': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64
Tên Chữ sợi dây

Hình dung

visual_domain_decathlon/cifar100

  • Mô tả cấu hình : Dữ liệu dựa trên "CIFAR-100", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 119.43 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'test' 10.000
'train' 40.000
'validation' 10.000
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=100),
    'name': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64
Tên Chữ sợi dây

Hình dung

visual_domain_decathlon/daimlerpedcls

  • Mô tả cấu hình : Dữ liệu dựa trên "Phân loại người đi bộ của Daimler", với các hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 68.35 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'test' 19.600
'train' 23,520
'validation' 5.880
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'name': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64
Tên Chữ sợi dây

Hình dung

visual_domain_decathlon/dtd

  • Mô tả cấu hình : Dữ liệu dựa trên "Hoạ tiết có thể mô tả", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 13.30 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'test' 1.880
'train' 1.880
'validation' 1.880
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=47),
    'name': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64
Tên Chữ sợi dây

Hình dung

visual_domain_decathlon/gtsrb

  • Mô tả cấu hình : Dữ liệu dựa trên "Biển báo giao thông ở Đức", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 80.58 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'test' 12.630
'train' 31,367
'validation' 7,842
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=43),
    'name': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64
Tên Chữ sợi dây

Hình dung

visual_domain_decathlon/imagenet12

  • Mô tả cấu hình : Dữ liệu dựa trên "Imagenet", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 6.11 GiB

  • Kích thước tập dữ liệu : 5.24 GiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'test' 48,238
'train' 1.232.167
'validation' 49.000
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'name': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64
Tên Chữ sợi dây

Hình dung

visual_domain_decathlon/omniglot

  • Mô tả cấu hình : Dữ liệu dựa trên "Omniglot", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 41.46 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'test' 8,115
'train' 17,853
'validation' 6,492
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1623),
    'name': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64
Tên Chữ sợi dây

Hình dung

visual_domain_decathlon/svhn

  • Mô tả cấu hình : Dữ liệu dựa trên "Số nhà ở Chế độ xem phố", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 135.32 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'test' 26.032
'train' 47,217
'validation' 26.040
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'name': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64
Tên Chữ sợi dây

Hình dung

visual_domain_decathlon/ucf101

  • Mô tả cấu hình : Dữ liệu dựa trên "Hình ảnh động UCF101", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 19.73 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'test' 3,783
'train' 7,585
'validation' 1.952
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=101),
    'name': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64
Tên Chữ sợi dây

Hình dung

visual_domain_decathlon/vgg-flowers

  • Mô tả cấu hình : Dữ liệu dựa trên "VGG-Flowers", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 20.87 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'test' 6.149
'train' 1.020
'validation' 1.020
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=102),
    'name': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64
Tên Chữ sợi dây

Hình dung