街並み

  • 説明:

Cityscapes は、1 年のさまざまな時期における 50 の異なる都市にわたる多様な都市のストリート シーンと、セマンティック セグメンテーション、インスタンス レベル セグメンテーション (TODO)、およびステレオ ペア視差推論を含むいくつかのビジョン タスクのグラウンド トゥルースで構成されるデータセットです。

セグメンテーション タスク (デフォルトの分割、「cityscapes/semantic_segmentation」経由でアクセス可能) の場合、Cityscapes は、トレーニング (2975)、検証 (500)、およびテスト (1525) セットに事前に分割された 1024 * 2048 解像度の 5000 画像の高密度ピクセル レベルの注釈を提供します。セグメンテーション タスクのラベル アノテーションは、シーンの認識を促進する際に一般的に遭遇する 30 以上のクラスにまたがっています。詳細なラベル情報はこちらにあります: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99

Cityscapes は、「train_extra」分割で 19998 枚の画像の粗粒度セグメンテーション アノテーション (「cityscapes/semantic_segmentation_extra」からアクセス可能) も提供します。これは、事前トレーニング / データ量の多いモデルに役立つ可能性があります。

セグメンテーションに加えて、都市景観は、通常の分割と余分な分割の両方で視差推論タスクのステレオ画像ペアとグラウンド トゥルースも提供します (それぞれ「cityscapes/stereo_disparity」と「cityscapes/stereo_disparity_extra」からアクセスできます)。

無視された例:

  • 「cityscapes/stereo_disparity_extra」の場合:
    • troisdorf_000000 000073 {*} 画像 (視差マップなし)
  • 追加のドキュメント:コードを使用したペーパーの探索

  • ホームページ: https://www.cityscapes-dataset.com

  • ソース コード: tfds.datasets.cityscapes.Builder

  • バージョン:

    • 1.0.0 (デフォルト): リリース ノートはありません。
  • ダウンロードサイズ: サイズUnknown size

  • 手動ダウンロードの手順: このデータセットでは、ソース データを手動でdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ) にダウンロードする必要があります。
    https://www.cityscapes-dataset.com/login/からファイルをダウンロードする必要があります (このデータセットには登録が必要です)。基本構成 (semantic_segmentation) については、「leftImg8bit_trainvaltest.zip」と「gtFine_trainvaltest.zip」をダウンロードする必要があります。その他の構成には追加のファイルが必要です。詳細については、コードを参照してください。

  • 自動キャッシュ(ドキュメント): いいえ

  • 監視されたキー( as_supervised docを参照): None

  • ( tfds.show_examples ): サポートされていません。

  • 引用

@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

街並み/semantic_segmentation (デフォルト設定)

  • 構成の説明: 都市景観のセマンティック セグメンテーション データセット。

  • データセットサイズ: 10.86 GiB

  • スプリット:

スプリット
'test' 1,525
'train' 2,975
'validation' 500
  • 機能構造:
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
image_id文章ストリング
image_left画像(1024、2048、3) uint8
セグメンテーション ラベル画像(1024、2048、1) uint8

街並み/semantic_segmentation_extra

  • 構成の説明: train_extra 分割ラベルと粗いラベルを使用した Cityscapes セマンティック セグメンテーション データセット。

  • データセットサイズ: 51.92 GiB

  • スプリット:

スプリット
'train' 2,975
'train_extra' 19,998
'validation' 500
  • 機能構造:
FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
image_id文章ストリング
image_left画像(1024、2048、3) uint8
セグメンテーション ラベル画像(1024、2048、1) uint8

街並み/stereo_disparity

  • 構成の説明: 都市景観のステレオ画像と視差マップのデータセット。

  • データセットサイズ: 25.03 GiB

  • スプリット:

スプリット
'test' 1,525
'train' 2,975
'validation' 500
  • 機能構造:
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
disparity_map画像(1024、2048、1) uint8
image_id文章ストリング
image_left画像(1024、2048、3) uint8
画像右画像(1024、2048、3) uint8

街並み/stereo_disparity_extra

  • 構成の説明: 都市景観のステレオ画像と視差マップのデータセット (train_extra 分割あり)。

  • データセットサイズ: 119.18 GiB

  • スプリット:

スプリット
'train' 2,975
'train_extra' 19,997
'validation' 500
  • 機能構造:
FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
disparity_map画像(1024、2048、1) uint8
image_id文章ストリング
image_left画像(1024、2048、3) uint8
画像右画像(1024、2048、3) uint8