TensorFlow Datasets: tập hợp các tập dữ liệu sẵn sàng sử dụng.

Tập dữ liệu TensorFlow là một tập hợp các tập dữ liệu sẵn sàng để sử dụng, với TensorFlow hoặc các khuôn khổ Python ML khác, chẳng hạn như Jax. Tất cả các bộ dữ liệu được hiển thị dưới dạng tf.data.Datasets , cho phép các đường ống đầu vào dễ sử dụng và hiệu suất cao. Để bắt đầu, hãy xem hướng dẫndanh sách các bộ dữ liệu của chúng tôi.
import tensorflow as tf
import tensorflow_datasets as tfds

# Construct a tf.data.Dataset
ds = tfds.load('mnist', split='train', shuffle_files=True)

# Build your input pipeline
ds = ds.shuffle(1024).batch(32).prefetch(tf.data.AUTOTUNE)
for example in ds.take(1):
  image, label = example["image"], example["label"]
Chạy trong Notebook