dolu

  • Açıklama :

Places veri seti, insanın görsel biliş ilkelerine göre tasarlanmıştır. Amacımız, sahne bağlamı, nesne tanıma, eylem ve olay tahmini ve zihin teorisi çıkarımı gibi üst düzey görsel anlama görevleri için yapay sistemleri eğitmek için kullanılabilecek bir görsel bilgi çekirdeği oluşturmaktır.

Yerlerin semantik kategorileri, işlevlerine göre tanımlanır: etiketler, bir ortamın giriş düzeyini temsil eder. Örnek vermek gerekirse, veri kümesinin farklı yatak odası veya sokak kategorileri vardır, çünkü biri aynı şekilde davranmaz ve bir ev yatak odasında, bir otel yatak odasında veya bir çocuk odasında daha sonra ne olabileceğine dair aynı tahminleri yapmaz. Toplamda, Yerler 400'den fazla benzersiz sahne kategorisinden oluşan 10 milyondan fazla resim içerir. Veri kümesi, gerçek dünyadaki oluşum sıklıklarıyla tutarlı olarak, sınıf başına 5000 ila 30.000 eğitim görüntüsü içerir. Evrişimli sinir ağlarını (CNN) kullanan Places veri seti, sahne merkezli kıyaslamalarda yeni son teknoloji performanslar oluşturmak amacıyla çeşitli sahne tanıma görevleri için derin sahne özelliklerinin öğrenilmesine olanak tanır.

Burada akademik araştırma ve eğitim amaçları için Yerler Veritabanını ve eğitimli CNN'leri sağlıyoruz.

Bölmek örnekler
'train' 10.653.087
  • Özellik yapısı :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(256, 256, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
dosya adı Metin sicim
görüntü resim (256, 256, 3) uint8
etiket SınıfEtiketi int64

görselleştirme

  • Alıntı :
@article{zhou2017places,
  title={Places: A 10 million Image Database for Scene Recognition},
  author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  year={2017},
  publisher={IEEE}
}