TFDS รองรับ รูปแบบ Croissant 🥐 แล้ว! อ่าน เอกสาร เพื่อทราบข้อมูลเพิ่มเติม

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

ฝึกอบรมโครงข่ายประสาทเทียมใน MNIST กับ Keras

ตัวอย่างง่ายๆ นี้สาธิตวิธีเสียบชุดข้อมูล TensorFlow (TFDS) ลงในโมเดล Keras

ดูบน TensorFlow.org

ทำงานใน Google Colab

ดูแหล่งที่มาบน GitHub

ดาวน์โหลดโน๊ตบุ๊ค

import tensorflow as tf
import tensorflow_datasets as tfds

ขั้นตอนที่ 1: สร้างไปป์ไลน์อินพุตของคุณ

เริ่มต้นด้วยการสร้างไปป์ไลน์อินพุตที่มีประสิทธิภาพโดยใช้คำแนะนำจาก:

คู่มือ เคล็ดลับประสิทธิภาพ
ประสิทธิภาพที่ ดีขึ้นด้วยคำแนะนำ tf.data API

โหลดชุดข้อมูล

โหลดชุดข้อมูล MNIST ด้วยอาร์กิวเมนต์ต่อไปนี้:

shuffle_files=True : ข้อมูล MNIST ถูกเก็บไว้ในไฟล์เดียว แต่สำหรับชุดข้อมูลขนาดใหญ่ที่มีไฟล์หลายไฟล์บนดิสก์ แนวทางปฏิบัติที่ดีในการสับเปลี่ยนเมื่อทำการฝึก
as_supervised=True : ส่งกลับ tuple (img, label) แทนพจนานุกรม {'image': img, 'label': label}

(ds_train, ds_test), ds_info = tfds.load(
    'mnist',
    split=['train', 'test'],
    shuffle_files=True,
    as_supervised=True,
    with_info=True,
)

2022-02-07 04:05:46.671689: E tensorflow/stream_executor/cuda/cuda_driver.cc:271] failed call to cuInit: CUDA_ERROR_NO_DEVICE: no CUDA-capable device is detected

สร้างไปป์ไลน์การฝึกอบรม

ใช้การแปลงต่อไปนี้:

tf.data.Dataset.map : TFDS จัดเตรียมรูปภาพประเภท tf.uint8 ในขณะที่โมเดลคาดหวัง tf.float32 ดังนั้น คุณต้องทำให้ภาพเป็นมาตรฐาน
tf.data.Dataset.cache เมื่อคุณพอดีกับชุดข้อมูลในหน่วยความจำแล้ว ให้แคชไว้ก่อนทำการสับเปลี่ยนเพื่อประสิทธิภาพที่ดีขึ้น
หมายเหตุ: ควรใช้การแปลงแบบสุ่มหลังจากการแคช
tf.data.Dataset.shuffle : สำหรับการสุ่มอย่างแท้จริง ให้ตั้งค่าบัฟเฟอร์การสลับเป็นขนาดชุดข้อมูลเต็ม
หมายเหตุ: สำหรับชุดข้อมูลขนาดใหญ่ที่ไม่สามารถใส่ในหน่วยความจำได้ ให้ใช้ buffer_size=1000 หากระบบของคุณอนุญาต
tf.data.Dataset.batch : องค์ประกอบแบทช์ของชุดข้อมูลหลังจากสับเปลี่ยนเพื่อรับแบตช์ที่ไม่ซ้ำกันในแต่ละยุค
tf.data.Dataset.prefetch : เป็นการดีที่จะสิ้นสุดไปป์ไลน์ด้วยการดึงข้อมูลล่วงหน้า สำหรับประสิทธิภาพ

def normalize_img(image, label):
  """Normalizes images: `uint8` -> `float32`."""
  return tf.cast(image, tf.float32) / 255., label

ds_train = ds_train.map(
    normalize_img, num_parallel_calls=tf.data.AUTOTUNE)
ds_train = ds_train.cache()
ds_train = ds_train.shuffle(ds_info.splits['train'].num_examples)
ds_train = ds_train.batch(128)
ds_train = ds_train.prefetch(tf.data.AUTOTUNE)

สร้างไปป์ไลน์การประเมิน

ไปป์ไลน์การทดสอบของคุณคล้ายกับไปป์ไลน์การฝึกโดยมีความแตกต่างเล็กน้อย:

คุณไม่จำเป็นต้องเรียก tf.data.Dataset.shuffle
การแคชเสร็จสิ้นหลังจากการแบทช์เนื่องจากแบทช์สามารถเหมือนกันระหว่างยุคได้

ds_test = ds_test.map(
    normalize_img, num_parallel_calls=tf.data.AUTOTUNE)
ds_test = ds_test.batch(128)
ds_test = ds_test.cache()
ds_test = ds_test.prefetch(tf.data.AUTOTUNE)

ขั้นตอนที่ 2: สร้างและฝึกโมเดล

เสียบไปป์ไลน์อินพุต TFDS ลงในโมเดล Keras อย่างง่าย คอมไพล์โมเดล และฝึกฝน

model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dense(10)
])
model.compile(
    optimizer=tf.keras.optimizers.Adam(0.001),
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    metrics=[tf.keras.metrics.SparseCategoricalAccuracy()],
)

model.fit(
    ds_train,
    epochs=6,
    validation_data=ds_test,
)

Epoch 1/6
469/469 [==============================] - 5s 4ms/step - loss: 0.3503 - sparse_categorical_accuracy: 0.9053 - val_loss: 0.1979 - val_sparse_categorical_accuracy: 0.9415
Epoch 2/6
469/469 [==============================] - 1s 2ms/step - loss: 0.1668 - sparse_categorical_accuracy: 0.9524 - val_loss: 0.1392 - val_sparse_categorical_accuracy: 0.9595
Epoch 3/6
469/469 [==============================] - 1s 2ms/step - loss: 0.1216 - sparse_categorical_accuracy: 0.9657 - val_loss: 0.1120 - val_sparse_categorical_accuracy: 0.9653
Epoch 4/6
469/469 [==============================] - 1s 2ms/step - loss: 0.0939 - sparse_categorical_accuracy: 0.9726 - val_loss: 0.0960 - val_sparse_categorical_accuracy: 0.9704
Epoch 5/6
469/469 [==============================] - 1s 2ms/step - loss: 0.0757 - sparse_categorical_accuracy: 0.9781 - val_loss: 0.0928 - val_sparse_categorical_accuracy: 0.9717
Epoch 6/6
469/469 [==============================] - 1s 2ms/step - loss: 0.0625 - sparse_categorical_accuracy: 0.9818 - val_loss: 0.0851 - val_sparse_categorical_accuracy: 0.9728
<keras.callbacks.History at 0x7f77b42cd910>