مناظر المدينة

  • الوصف :

مناظر المدينة عبارة عن مجموعة بيانات تتكون من مشاهد شوارع حضرية متنوعة عبر 50 مدينة مختلفة في أوقات مختلفة من العام بالإضافة إلى حقائق أساسية للعديد من مهام الرؤية بما في ذلك التجزئة الدلالي ، وتجزئة مستوى المثيل (TODO) ، واستدلال تباين زوج الاستريو.

بالنسبة إلى مهام التجزئة (التقسيم الافتراضي ، الذي يمكن الوصول إليه عبر "مناظر المدينة / semantic_segmentation") ، توفر مناظر المدينة تعليقات توضيحية على مستوى البكسل الكثيف لـ 5000 صورة بدقة 1024 * 2048 مقسمة مسبقًا إلى مجموعات تدريب (2975) ، والتحقق من الصحة (500) واختبار (1525). تمتد التعليقات التوضيحية لمهام التجزئة عبر أكثر من 30 فئة يتم مواجهتها بشكل شائع أثناء تصور مشهد القيادة. يمكن العثور على معلومات التسمية التفصيلية هنا: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99

توفر مناظر المدينة أيضًا تعليقات توضيحية لتجزئة الحبوب الخشنة (يمكن الوصول إليها عبر "مناظر المدينة / semantic_segmentation_extra") لعام 19998 من الصور في تقسيم "train_extra" والذي قد يكون مفيدًا في نماذج التدريب المسبق / البيانات الثقيلة.

إلى جانب التقسيم ، توفر مناظر المدينة أيضًا أزواج صور مجسمة وحقائق أساسية لمهام استدلال التباين في كل من الانقسامات العادية والإضافية (يمكن الوصول إليها عبر "مناظر المدينة / التباين المجسم" و "مناظر المدينة / stereo_disparity_extra" على التوالي).

أمثلة مضمونة:

  • بالنسبة إلى "مناظر المدينة / stereo_disparity_extra":
    • صور troisdorf_000000 000073 {*} (لا توجد خريطة تباين)
  • وثائق إضافية : استكشف في الأوراق باستخدام الرمز

  • الصفحة الرئيسية : https://www.cityscapes-dataset.com

  • كود المصدر : tfds.datasets.cityscapes.Builder

  • إصدارات :

    • 1.0.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
  • حجم التنزيل : Unknown size

  • إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى download_config.manual_dir (الإعدادات الافتراضية على ~/tensorflow_datasets/downloads/manual/ ):
    يجب عليك تنزيل الملفات من https://www.cityscapes-dataset.com/login/ (تتطلب مجموعة البيانات هذه التسجيل). للتكوين الأساسي (semantic_segmentation) ، يجب عليك تنزيل "leftImg8bit_trainvaltest.zip" و "gtFine_trainvaltest.zip". تتطلب التكوينات الأخرى ملفات إضافية - يرجى الاطلاع على الكود لمزيد من التفاصيل.

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • المفاتيح الخاضعة للإشراف (انظر المستند as_supervised ): None

  • الشكل ( tfds.show_examples ): غير مدعوم.

  • الاقتباس :

@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

مناظر المدينة / semantic_segmentation (التكوين الافتراضي)

  • وصف التكوين : مجموعة بيانات التجزئة الدلالية لمناظر المدينة.

  • حجم مجموعة البيانات : 10.86 GiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 1،525
'train' 2975
'validation' 500
  • هيكل الميزة :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
معرّف_صورة نص سلسلة
image_left صورة (1024 ، 2048 ، 3) uint8
تقسيم_تصنيف صورة (1024 ، 2048 ، 1) uint8

مناظر المدينة / semantic_segmentation_extra

  • وصف التكوين : مجموعة بيانات التجزئة الدلالية لمناظر المدينة مع تسميات train_extra المنقسمة والخشنة.

  • حجم مجموعة البيانات : 51.92 GiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 2975
'train_extra' 19998
'validation' 500
  • هيكل الميزة :
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
معرّف_صورة نص سلسلة
image_left صورة (1024 ، 2048 ، 3) uint8
تقسيم_تصنيف صورة (1024 ، 2048 ، 1) uint8

مناظر المدينة / ستيريو_تباين

  • وصف التكوين : صورة مجسمة لمناظر المدينة ومجموعة بيانات خرائط التباين.

  • حجم مجموعة البيانات : 25.03 GiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 1،525
'train' 2975
'validation' 500
  • هيكل الميزة :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
خريطة_تباين صورة (1024 ، 2048 ، 1) uint8
معرّف_صورة نص سلسلة
image_left صورة (1024 ، 2048 ، 3) uint8
صورة_حق صورة (1024 ، 2048 ، 3) uint8

مناظر المدينة / stereo_disparity_extra

  • وصف التكوين : مجموعة بيانات صور ستريو مناظر المدينة وخرائط التباين مع تقسيم train_extra.

  • حجم مجموعة البيانات : 119.18 GiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 2975
'train_extra' 19997
'validation' 500
  • هيكل الميزة :
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
خريطة_تباين صورة (1024 ، 2048 ، 1) uint8
معرّف_صورة نص سلسلة
image_left صورة (1024 ، 2048 ، 3) uint8
صورة_حق صورة (1024 ، 2048 ، 3) uint8