sun397

このデータベースには、シーン理解 (SUN) ベンチマークで使用される 397 カテゴリの 108,753 枚の画像が含まれています。画像の数はカテゴリによって異なりますが、カテゴリごとに少なくとも 100 枚の画像があります。

データセットのいくつかの構成は、TFDS を通じて利用可能になります。

  • 76,128 個のトレーニング イメージ、10,875 個の検証イメージ、および 21,750 個のテスト イメージを含む、データセット全体のカスタム (ランダム) パーティション。画像は最大 120,000 ピクセルにサイズ変更され、72 の品質で JPEG としてエンコードされています。

  • "standard-part1-120k", "standard-part2-120k", ..., "standard-part10-120k": 10 個の公式のトレーニング/テスト パーティションのそれぞれで、各分割のクラスごとに 50 個の画像があります。画像は最大 120,000 ピクセルにサイズ変更され、72 の品質で JPEG としてエンコードされています。

  • 追加のドキュメント:コードを使用したペーパーの探索

  • ホームページ: https://vision.princeton.edu/projects/2010/SUN/

  • ソースコード: tfds.datasets.sun397.Builder

  • バージョン:

    • 4.0.0 (デフォルト): リリース ノートはありません。
  • ダウンロードサイズ: 36.41 GiB

  • データセットのサイズ: サイズUnknown size

  • 自動キャッシュ(ドキュメント): 不明

  • 機能構造:

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=397),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ファイル名文章ストリング
画像画像(なし、なし、3) uint8
ラベルクラスラベルint64
@INPROCEEDINGS{Xiao:2010,
author={J. {Xiao} and J. {Hays} and K. A. {Ehinger} and A. {Oliva} and A. {Torralba} },
booktitle={2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
title={SUN database: Large-scale scene recognition from abbey to zoo},
year={2010},
volume={},
number={},
pages={3485-3492},
keywords={computer vision;human factors;image classification;object recognition;visual databases;SUN database;large-scale scene recognition;abbey;zoo;scene categorization;computer vision;scene understanding research;scene category;object categorization;scene understanding database;state-of-the-art algorithms;human scene classification performance;finer-grained scene representation;Sun;Large-scale systems;Layout;Humans;Image databases;Computer vision;Anthropometry;Bridges;Legged locomotion;Spatial databases},
doi={10.1109/CVPR.2010.5539970},
ISSN={1063-6919},
month={June},}

sun397/tfds (デフォルト設定)

  • 構成の説明: 画像の 70%/10%/20% をそれぞれランダムにトレーニング/検証/テスト分割する TFDS パーティション。画像は最大 120,000 ピクセルにサイズ変更され、72 JPEG 品質で圧縮されます。

  • スプリット:

スプリット
'test' 21,750
'train' 76,128
'validation' 10,875

視覚化

sun397/standard-part1-120k

  • 構成の説明: 公式のパーティション番号 1 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • スプリット:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part2-120k

  • 構成の説明: 公式のパーティション番号 2 からの分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • スプリット:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part3-120k

  • 構成の説明: 公式のパーティション番号 3 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • スプリット:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part4-120k

  • 構成の説明: 公式のパーティション番号 4 からの分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • スプリット:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part5-120k

  • 構成の説明: 公式のパーティション番号 5 からの分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • スプリット:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part6-120k

  • 構成の説明: 公式のパーティション番号 6 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • スプリット:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part7-120k

  • 構成の説明: 公式のパーティション番号 7 から分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • スプリット:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part8-120k

  • 構成の説明: 公式パーティション番号 8 からの分割のトレーニングとテスト。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • スプリット:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part9-120k

  • 構成の説明: 公式パーティション番号 9 からの分割のトレーニングとテスト。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • スプリット:

スプリット
'test' 19,850
'train' 19,850

視覚化

sun397/standard-part10-120k

  • 構成の説明: 公式のパーティション番号 10 からの分割をトレーニングおよびテストします。画像は最大 120,000 ピクセルになるようにサイズ変更され、72 JPEG 品質で圧縮されます。

  • スプリット:

スプリット
'test' 19,850
'train' 19,850

視覚化