Görselleştirme : Verilerinizi
Açıklama :
Açık Görüntüler, görüntü düzeyinde etiketler ve nesne sınırlayıcı kutularla açıklama eklenmiş ~9 milyon görüntüden oluşan bir veri kümesidir.
V4 eğitim seti, 1,74M görüntülerde 600 nesne sınıfı için 14.6M sınırlayıcı kutu içerir ve bu da onu nesne konumu açıklamalarıyla mevcut en büyük veri kümesi yapar. Kutular, doğruluk ve tutarlılığı sağlamak için profesyonel yorumcular tarafından büyük ölçüde manuel olarak çizilmiştir. Görüntüler çok çeşitlidir ve genellikle birkaç nesne içeren karmaşık sahneler içerir (görüntü başına ortalama 8.4). Ayrıca, veri kümesine binlerce sınıfa yayılan görüntü düzeyinde etiketlerle açıklama eklenir.
Ana sayfa : https://storage.googleapis.com/openimages/web/index.html
Kaynak kodu :
tfds.object_detection.OpenImagesV4
Sürümler :
-
2.0.0
(varsayılan): Yeni bölünmüş API ( https://tensorflow.org/datasets/splits )
-
İndirme boyutu :
565.11 GiB
Veri kümesi boyutu :
Unknown size
Otomatik önbelleğe alındı ( belgeler ): Bilinmiyor
Bölmeler :
Bölmek | Örnekler |
---|---|
'test' | 125.436 |
'train' | 1.743.042 |
'validation' | 41.620 |
- Özellik yapısı :
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
'is_depiction': tf.int8,
'is_group_of': tf.int8,
'is_inside': tf.int8,
'is_occluded': tf.int8,
'is_truncated': tf.int8,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=601),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
}),
'image': Image(shape=(None, None, 3), dtype=tf.uint8),
'image/filename': Text(shape=(), dtype=tf.string),
'objects': Sequence({
'confidence': tf.int32,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=19995),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
}),
'objects_trainable': Sequence({
'confidence': tf.int32,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=7186),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
bobjects | Sekans | |||
bobjects/bbox | BBoxÖzelliği | (4,) | tf.float32 | |
bobjects/is_depiction | tensör | tf.int8 | ||
bobjects/is_group_of | tensör | tf.int8 | ||
bobjects/is_inside | tensör | tf.int8 | ||
bobjects/is_occluded | tensör | tf.int8 | ||
bobjects/is_truncated | tensör | tf.int8 | ||
bobjects/etiket | sınıf etiketi | tf.int64 | ||
bobjects/kaynak | sınıf etiketi | tf.int64 | ||
resim | resim | (Yok, Yok, 3) | tf.uint8 | |
resim/dosya adı | Metin | tf.string | ||
nesneler | Sekans | |||
nesneler/güven | tensör | tf.int32 | ||
nesneler/etiket | sınıf etiketi | tf.int64 | ||
nesneler/kaynak | sınıf etiketi | tf.int64 | ||
nesneler_eğitilebilir | Sekans | |||
nesneler_eğitilebilir/güven | tensör | tf.int32 | ||
nesneler_eğitilebilir/etiket | sınıf etiketi | tf.int64 | ||
nesneler_eğitilebilir/kaynak | sınıf etiketi | tf.int64 |
Denetimli anahtarlar (bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmez.
Örnekler ( tfds.as_dataframe ): Eksik.
alıntı :
@article{OpenImages,
author = {Alina Kuznetsova and
Hassan Rom and
Neil Alldrin and
Jasper Uijlings and
Ivan Krasin and
Jordi Pont-Tuset and
Shahab Kamali and
Stefan Popov and
Matteo Malloci and
Tom Duerig and
Vittorio Ferrari},
title = {The Open Images Dataset V4: Unified image classification,
object detection, and visual relationship detection at scale},
year = {2018},
journal = {arXiv:1811.00982}
}
@article{OpenImages2,
author = {Krasin, Ivan and
Duerig, Tom and
Alldrin, Neil and
Ferrari, Vittorio
and Abu-El-Haija, Sami and
Kuznetsova, Alina and
Rom, Hassan and
Uijlings, Jasper and
Popov, Stefan and
Kamali, Shahab and
Malloci, Matteo and
Pont-Tuset, Jordi and
Veit, Andreas and
Belongie, Serge and
Gomes, Victor and
Gupta, Abhinav and
Sun, Chen and
Chechik, Gal and
Cai, David and
Feng, Zheyun and
Narayanan, Dhyanesh and
Murphy, Kevin},
title = {OpenImages: A public dataset for large-scale multi-label and
multi-class image classification.},
journal = {Dataset available from
https://storage.googleapis.com/openimages/web/index.html},
year={2017}
}
open_images_v4/orijinal (varsayılan yapılandırma)
- Yapılandırma açıklaması : Görüntüler orijinal çözünürlüklerinde ve kalitesinde.
open_images_v4/300k
- Yapılandırma açıklaması : Görüntüler, 72 JPEG kalitesinde yaklaşık 300.000 piksele sahiptir.
open_images_v4/200k
- Yapılandırma açıklaması : Görüntüler, 72 JPEG kalitesinde yaklaşık 200.000 piksele sahiptir.