נופי עיר

  • תיאור:

Cityscapes הוא מערך נתונים המורכב מסצנות רחוב עירוניות מגוונות על פני 50 ערים שונות בתקופות שונות בשנה, כמו גם אמיתות קרקעיות למספר משימות ראייה, כולל פילוח סמנטי, פילוח רמות מופעים (TODO) והסקת פער סטריאו.

עבור משימות פילוח (פיצול ברירת מחדל, הנגיש באמצעות 'cityscapes/semantic_segmentation'), Cityscapes מספק ביאורים צפופים ברמת הפיקסלים עבור 5000 תמונות ברזולוציה של 1024 * 2048 מראש לחלקי אימונים (2975), אימות (500) ובדיקות (1525). ביאורי תוויות למשימות פילוח נפרשות על פני 30 שיעורים ומעלה הנפוצים במהלך תפיסת סצנת נהיגה. מידע תווית מפורטת ניתן למצוא כאן: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99

Cityscapes מספקת גם ביאורי פילוח דגנים גסים (הנגישים באמצעות 'cityscapes / semantic_segmentation_extra') עבור 19998 תמונות בפצל 'train_extra' שעשוי להיות שימושי עבור מודלים של אימון מוקדם / כבד-נתונים.

פרט לפילוח, cityscapes מספקת גם זוגות תמונות סטריאו ואמיתות קרקע למשימות הסקה של פערים הן על הפיצולים הנורמליים והן הנוספים הנוספים (נגיש באמצעות 'cityscapes/stereo_disparity' ו- 'cityscapes/stereo_disparity_extra' בהתאמה).

דוגמאות מובנות:

  • עבור 'cityscapes/stereo_disparity_extra':
    • troisdorf_000000 000,073 {*} תמונות (לא נוכח מפת הבדל)
  • דף הבית: https://www.cityscapes-dataset.com

  • קוד מקור: tfds.image.Cityscapes

  • גרסאות:

    • 1.0.0 (ברירת המחדל): הערות השחרור לא.
  • גודל ההורדה: Unknown size

  • הוראות הורדה ידנית: מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני לתוך download_config.manual_dir (ברירת המחדל היא ~/tensorflow_datasets/downloads/manual/ ):
    אתה צריך להוריד קבצי https://www.cityscapes-dataset.com/login/ (מערך נתונים זה דורש רישום). לתצורה בסיסית (semantic_segmentation) עליך להוריד את 'leftImg8bit_trainvaltest.zip' ו- 'gtFine_trainvaltest.zip'. קונפיג אחרים דורשים קבצים נוספים - אנא עיין בקוד לפרטים נוספים.

  • Auto-במטמון ( תיעוד ): אין

  • מפתחות השגחה (ראה as_supervised doc ): None

  • איור ( tfds.show_examples ): לא נתמך.

  • ציטוט:

@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

cityscapes/semantic_segmentation (תצורת ברירת מחדל)

  • תיאור Config: הנתונים פילוח סמנטי ונופים עירוניים.

  • גודל בסיס הנתונים: 10.86 GiB

  • פיצולים:

לְפַצֵל דוגמאות
'test' 1,525
'train' 2,975
'validation' 500
  • מאפיינים:
FeaturesDict({
    'image_id': Text(shape=(), dtype=tf.string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=tf.uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=tf.uint8),
})

נופים עירוניים/סמנטיים_הפלגה_תוספת

  • תיאור Config: נתון פילוח סמנטיים ונופים עירוניים עם פיצול train_extra ותוויות גסות.

  • גודל בסיס הנתונים: 51.92 GiB

  • פיצולים:

לְפַצֵל דוגמאות
'train' 2,975
'train_extra' 19,998
'validation' 500
  • מאפיינים:
FeaturesDict({
    'image_id': Text(shape=(), dtype=tf.string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=tf.uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=tf.uint8),
})

נופים עירוניים/פער_סטריאו

  • תיאור Config: תמונת הסטריאו נוף עירוני פער ממפה הנתונים.

  • גודל בסיס הנתונים: 25.03 GiB

  • פיצולים:

לְפַצֵל דוגמאות
'test' 1,525
'train' 2,975
'validation' 500
  • מאפיינים:
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=tf.uint8),
    'image_id': Text(shape=(), dtype=tf.string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=tf.uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=tf.uint8),
})

cityscapes/stereo_disparity_extra

  • תיאור Config: תמונת הסטריאו נוף עירוני פער ממפה במערך עם train_extra מפוצל.

  • גודל בסיס הנתונים: 119.18 GiB

  • פיצולים:

לְפַצֵל דוגמאות
'train' 2,975
'train_extra' 19,997
'validation' 500
  • מאפיינים:
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=tf.uint8),
    'image_id': Text(shape=(), dtype=tf.string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=tf.uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=tf.uint8),
})