TensorFlow Datasets:一組可立即使用的資料集。

TensorFlow Datasets 是一組立即可用的資料集,搭配 TensorFlow 或 Jax 等其他 Python 機器學習架構。所有資料集都會以 tf.data.Datasets 的形式公開,以提供方便使用且具備高效能的輸入管線。請參閱指南和我們的資料集清單,瞭解如何開始使用。
import tensorflow.compat.v2 as tf
import tensorflow_datasets as tfds

# Construct a tf.data.Dataset
ds = tfds.load('mnist', split='train', shuffle_files=True)

# Build your input pipeline
ds = ds.shuffle(1024).batch(32).prefetch(tf.data.experimental.AUTOTUNE)
for example in ds.take(1):
  image, label = example["image"], example["label"]
筆記本中執行