food101

  • 説明

このデータセットは、101の食品カテゴリと101,000の画像で構成されています。クラスごとに、250の手動でレビューされたテスト画像と750のトレーニング画像が提供されます。意図的に、トレーニング画像はクリーンアップされていないため、ある程度のノイズが含まれています。これは主に濃い色と時々間違ったラベルの形で来ます。すべての画像は、最大辺の長さが512ピクセルになるように再スケーリングされました。

スプリット
'train' 75,750
'validation' 25,250
  • 特長
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=101),
})

視覚化

  • 引用
@inproceedings{bossard14,
  title = {Food-101 -- Mining Discriminative Components with Random Forests},
  author = {Bossard, Lukas and Guillaumin, Matthieu and Van Gool, Luc},
  booktitle = {European Conference on Computer Vision},
  year = {2014}
}