Помогают защитить Большой Барьерный Риф с TensorFlow на Kaggle Присоединяйтесь вызов

Нетерпеливое исполнение

Посмотреть на TensorFlow.org Запускаем в Google Colab Посмотреть исходный код на GitHub Скачать блокнот

Активное выполнение TensorFlow - это обязательная среда программирования, которая оценивает операции немедленно, без построения графиков: операции возвращают конкретные значения вместо построения вычислительного графа для последующего запуска. Это упрощает начало работы с TensorFlow и отладкой моделей, а также сокращает количество шаблонов. Для того, чтобы следовать вместе с этим руководством, запустить примеры кода ниже в интерактивном python переводчика.

Стремительное исполнение - это гибкая платформа машинного обучения для исследований и экспериментов, обеспечивающая:

  • Интуитивный интерфейс -структуры коды естественно и использовать структуры данных Python. Быстро перебирайте небольшие модели и небольшие данные.
  • Легче отладки -Call опа непосредственно проверять запущенные модели и тестировать изменения. Используйте стандартные инструменты отладки Python для немедленного сообщения об ошибках.
  • Естественный контроль расход потока управления -Использованием Python вместо потока управления графами, упрощая спецификации динамических моделей.

Активное выполнение поддерживает большинство операций TensorFlow и ускорение графического процессора.

Настройка и базовое использование

import os

import tensorflow as tf

import cProfile

В Tensorflow 2.0 по умолчанию включено активное выполнение.

tf.executing_eagerly()
True

Теперь вы можете запускать операции TensorFlow, и результаты будут немедленно возвращены:

x = [[2.]]
m = tf.matmul(x, x)
print("hello, {}".format(m))
hello, [[4.]]

Включение активного выполнения изменяет поведение операций TensorFlow - теперь они немедленно оценивают и возвращают свои значения в Python. tf.Tensor объекты эталонных конкретные значений вместо символических дескрипторов узлов в расчетной графике. Поскольку не существует вычислительный граф , чтобы построить и запустить в конце сеанса, легко проверять результаты с помощью print() или отладчик. Оценка, печать и проверка значений тензора не прерывают процесс вычисления градиентов.

Нетерпеливый выполнение прекрасно работает с NumPy . Операции Numpy принимают tf.Tensor аргументы. В TensorFlow tf.math операции преобразования объектов Python и Numpy массивы tf.Tensor объектов. tf.Tensor.numpy метод возвращает значение объекта в качестве NumPy ndarray .

a = tf.constant([[1, 2],
                 [3, 4]])
print(a)
tf.Tensor(
[[1 2]
 [3 4]], shape=(2, 2), dtype=int32)
# Broadcasting support
b = tf.add(a, 1)
print(b)
tf.Tensor(
[[2 3]
 [4 5]], shape=(2, 2), dtype=int32)
# Operator overloading is supported
print(a * b)
tf.Tensor(
[[ 2  6]
 [12 20]], shape=(2, 2), dtype=int32)
# Use NumPy values
import numpy as np

c = np.multiply(a, b)
print(c)
[[ 2  6]
 [12 20]]
# Obtain numpy value from a tensor:
print(a.numpy())
# => [[1 2]
#     [3 4]]
[[1 2]
 [3 4]]

Динамический поток управления

Основным преимуществом активного выполнения является то, что все функции основного языка доступны во время выполнения вашей модели. Так, например, легко записи FizzBuzz :

def fizzbuzz(max_num):
  counter = tf.constant(0)
  max_num = tf.convert_to_tensor(max_num)
  for num in range(1, max_num.numpy()+1):
    num = tf.constant(num)
    if int(num % 3) == 0 and int(num % 5) == 0:
      print('FizzBuzz')
    elif int(num % 3) == 0:
      print('Fizz')
    elif int(num % 5) == 0:
      print('Buzz')
    else:
      print(num.numpy())
    counter += 1
fizzbuzz(15)
1
2
Fizz
4
Buzz
Fizz
7
8
Fizz
Buzz
11
Fizz
13
14
FizzBuzz

У него есть условные выражения, которые зависят от значений тензора, и он печатает эти значения во время выполнения.

Нетерпеливое обучение

Вычислительные градиенты

Автоматическое дифференцирование полезно для реализации алгоритмов машинного обучения , таких как обратное распространение для обучения нейронных сетей. Во время выполнения нетерпеливого, использовать tf.GradientTape для отслеживания операций для вычисления градиентов позже.

Вы можете использовать tf.GradientTape для обучения и / или вычислительные градиентов в нетерпеливы. Это особенно полезно для сложных тренировочных циклов.

Поскольку во время каждого вызова могут выполняться разные операции, все операции прямого прохода записываются на «ленту». Чтобы вычислить градиент, воспроизведите ленту в обратном направлении, а затем выбросьте. Конкретный tf.GradientTape может только вычислить один градиент; последующие вызовы вызывают ошибку времени выполнения.

w = tf.Variable([[1.0]])
with tf.GradientTape() as tape:
  loss = w * w

grad = tape.gradient(loss, w)
print(grad)  # => tf.Tensor([[ 2.]], shape=(1, 1), dtype=float32)
tf.Tensor([[2.]], shape=(1, 1), dtype=float32)

Обучить модель

В следующем примере создается многоуровневая модель, которая классифицирует стандартные рукописные цифры MNIST. Он демонстрирует оптимизатор и API слоев для построения обучаемых графиков в среде активного выполнения.

# Fetch and format the mnist data
(mnist_images, mnist_labels), _ = tf.keras.datasets.mnist.load_data()

dataset = tf.data.Dataset.from_tensor_slices(
  (tf.cast(mnist_images[...,tf.newaxis]/255, tf.float32),
   tf.cast(mnist_labels,tf.int64)))
dataset = dataset.shuffle(1000).batch(32)
# Build the model
mnist_model = tf.keras.Sequential([
  tf.keras.layers.Conv2D(16,[3,3], activation='relu',
                         input_shape=(None, None, 1)),
  tf.keras.layers.Conv2D(16,[3,3], activation='relu'),
  tf.keras.layers.GlobalAveragePooling2D(),
  tf.keras.layers.Dense(10)
])

Даже без обучения вызовите модель и просмотрите результат в нетерпеливом исполнении:

for images,labels in dataset.take(1):
  print("Logits: ", mnist_model(images[0:1]).numpy())
Logits:  [[-0.01775933 -0.01194787 -0.08372174 -0.06535977  0.00338565 -0.01974326
  -0.04763228  0.00904049 -0.00144051 -0.01944664]]

В то время как keras модель имеет встроенные тренировочный цикл (используя fit метод), иногда требуется больше настроек. Вот пример цикла обучения, реализованного с помощью eager:

optimizer = tf.keras.optimizers.Adam()
loss_object = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)

loss_history = []
def train_step(images, labels):
  with tf.GradientTape() as tape:
    logits = mnist_model(images, training=True)

    # Add asserts to check the shape of the output.
    tf.debugging.assert_equal(logits.shape, (32, 10))

    loss_value = loss_object(labels, logits)

  loss_history.append(loss_value.numpy().mean())
  grads = tape.gradient(loss_value, mnist_model.trainable_variables)
  optimizer.apply_gradients(zip(grads, mnist_model.trainable_variables))
def train(epochs):
  for epoch in range(epochs):
    for (batch, (images, labels)) in enumerate(dataset):
      train_step(images, labels)
    print ('Epoch {} finished'.format(epoch))
train(epochs = 3)
Epoch 0 finished
Epoch 1 finished
Epoch 2 finished
import matplotlib.pyplot as plt

plt.plot(loss_history)
plt.xlabel('Batch #')
plt.ylabel('Loss [entropy]')
Text(0, 0.5, 'Loss [entropy]')

PNG

Переменные и оптимизаторы

tf.Variable объекты хранения изменяемых tf.Tensor -like значений , доступных во время тренировки , чтобы сделать автоматическую дифференциацию проще.

Коллекции переменных могут быть инкапсулированы в слои или модели вместе с методами, которые с ними работают. См Пользовательского Keras слоев и модели для деталей. Основное различие между слоями и моделей является то , что модели добавить такие методы , как Model.fit , Model.evaluate и Model.save .

Например, приведенный выше пример автоматического дифференцирования можно переписать:

class Linear(tf.keras.Model):
  def __init__(self):
    super(Linear, self).__init__()
    self.W = tf.Variable(5., name='weight')
    self.B = tf.Variable(10., name='bias')
  def call(self, inputs):
    return inputs * self.W + self.B
# A toy dataset of points around 3 * x + 2
NUM_EXAMPLES = 2000
training_inputs = tf.random.normal([NUM_EXAMPLES])
noise = tf.random.normal([NUM_EXAMPLES])
training_outputs = training_inputs * 3 + 2 + noise

# The loss function to be optimized
def loss(model, inputs, targets):
  error = model(inputs) - targets
  return tf.reduce_mean(tf.square(error))

def grad(model, inputs, targets):
  with tf.GradientTape() as tape:
    loss_value = loss(model, inputs, targets)
  return tape.gradient(loss_value, [model.W, model.B])

Следующий:

  1. Создайте модель.
  2. Производные функции потерь по параметрам модели.
  3. Стратегия обновления переменных на основе производных.
model = Linear()
optimizer = tf.keras.optimizers.SGD(learning_rate=0.01)

print("Initial loss: {:.3f}".format(loss(model, training_inputs, training_outputs)))

steps = 300
for i in range(steps):
  grads = grad(model, training_inputs, training_outputs)
  optimizer.apply_gradients(zip(grads, [model.W, model.B]))
  if i % 20 == 0:
    print("Loss at step {:03d}: {:.3f}".format(i, loss(model, training_inputs, training_outputs)))
Initial loss: 69.909
Loss at step 000: 67.145
Loss at step 020: 30.170
Loss at step 040: 13.859
Loss at step 060: 6.659
Loss at step 080: 3.479
Loss at step 100: 2.074
Loss at step 120: 1.453
Loss at step 140: 1.178
Loss at step 160: 1.056
Loss at step 180: 1.003
Loss at step 200: 0.979
Loss at step 220: 0.968
Loss at step 240: 0.963
Loss at step 260: 0.961
Loss at step 280: 0.960
print("Final loss: {:.3f}".format(loss(model, training_inputs, training_outputs)))
Final loss: 0.960
print("W = {}, B = {}".format(model.W.numpy(), model.B.numpy()))
W = 2.9515867233276367, B = 2.0210201740264893

Объектно-ориентированное сохранение

tf.keras.Model включает в себя удобный save_weights метод , позволяющий легко создавать контрольные точки:

model.save_weights('weights')
status = model.load_weights('weights')

Использование tf.train.Checkpoint вы можете получить полный контроль над этим процессом.

Этот раздел представляет собой сокращенный вариант руководства для подготовки контрольных точек .

x = tf.Variable(10.)
checkpoint = tf.train.Checkpoint(x=x)
x.assign(2.)   # Assign a new value to the variables and save.
checkpoint_path = './ckpt/'
checkpoint.save(checkpoint_path)
'./ckpt/-1'
x.assign(11.)  # Change the variable after saving.

# Restore values from the checkpoint
checkpoint.restore(tf.train.latest_checkpoint(checkpoint_path))

print(x)  # => 2.0
<tf.Variable 'Variable:0' shape=() dtype=float32, numpy=2.0>

Чтобы сохранить и загрузить модели, tf.train.Checkpoint сохраняет внутреннее состояние объектов, не требуя скрытых переменных. Для того, чтобы записать состояние model , с optimizer , и глобальный шаг, передать их в tf.train.Checkpoint :

model = tf.keras.Sequential([
  tf.keras.layers.Conv2D(16,[3,3], activation='relu'),
  tf.keras.layers.GlobalAveragePooling2D(),
  tf.keras.layers.Dense(10)
])
optimizer = tf.keras.optimizers.Adam(learning_rate=0.001)
checkpoint_dir = 'path/to/model_dir'
if not os.path.exists(checkpoint_dir):
  os.makedirs(checkpoint_dir)
checkpoint_prefix = os.path.join(checkpoint_dir, "ckpt")
root = tf.train.Checkpoint(optimizer=optimizer,
                           model=model)

root.save(checkpoint_prefix)
root.restore(tf.train.latest_checkpoint(checkpoint_dir))
<tensorflow.python.training.tracking.util.CheckpointLoadStatus at 0x7f4ba0648310>

Объектно-ориентированные метрики

tf.keras.metrics хранятся в виде объектов. Обновление метрики, передавая новые данные в Callable, и получить результат , используя tf.keras.metrics.result метод, например:

m = tf.keras.metrics.Mean("loss")
m(0)
m(5)
m.result()  # => 2.5
m([8, 9])
m.result()  # => 5.5
<tf.Tensor: shape=(), dtype=float32, numpy=5.5>

Резюме и TensorBoard

TensorBoard является инструментом визуализации для понимания, отладки и оптимизации процесса обучения модели. Он использует сводные события, которые записываются во время выполнения программы.

Вы можете использовать tf.summary для записи резюме переменных в нетерпеливом исполнении. Например, чтобы записать сводки loss раз каждые 100 тренировочных этапов:

logdir = "./tb/"
writer = tf.summary.create_file_writer(logdir)

steps = 1000
with writer.as_default():  # or call writer.set_as_default() before the loop.
  for i in range(steps):
    step = i + 1
    # Calculate loss with your real train function.
    loss = 1 - 0.001 * step
    if step % 100 == 0:
      tf.summary.scalar('loss', loss, step=step)
ls tb/
events.out.tfevents.1632342765.kokoro-gcp-ubuntu-prod-230753280.22287.0.v2

Расширенные темы автоматической дифференциации

Динамические модели

tf.GradientTape также может быть использован в динамических моделях. В этом примере для обратного прослеживания линии поиска алгоритм выглядит как обычный код NumPy, за исключением того, существуют градиенты и дифференцируема, несмотря на сложный поток управления:

def line_search_step(fn, init_x, rate=1.0):
  with tf.GradientTape() as tape:
    # Variables are automatically tracked.
    # But to calculate a gradient from a tensor, you must `watch` it.
    tape.watch(init_x)
    value = fn(init_x)
  grad = tape.gradient(value, init_x)
  grad_norm = tf.reduce_sum(grad * grad)
  init_value = value
  while value > init_value - rate * grad_norm:
    x = init_x - rate * grad
    value = fn(x)
    rate /= 2.0
  return x, value

Пользовательские градиенты

Пользовательские градиенты - это простой способ переопределить градиенты. Внутри прямой функции определите градиент по отношению к входам, выходам или промежуточным результатам. Например, вот простой способ обрезать норму градиентов при обратном проходе:

@tf.custom_gradient
def clip_gradient_by_norm(x, norm):
  y = tf.identity(x)
  def grad_fn(dresult):
    return [tf.clip_by_norm(dresult, norm), None]
  return y, grad_fn

Пользовательские градиенты обычно используются для обеспечения численно стабильного градиента для последовательности операций:

def log1pexp(x):
  return tf.math.log(1 + tf.exp(x))

def grad_log1pexp(x):
  with tf.GradientTape() as tape:
    tape.watch(x)
    value = log1pexp(x)
  return tape.gradient(value, x)
# The gradient computation works fine at x = 0.
grad_log1pexp(tf.constant(0.)).numpy()
0.5
# However, x = 100 fails because of numerical instability.
grad_log1pexp(tf.constant(100.)).numpy()
nan

Здесь log1pexp функция может быть аналитически упрощена с помощью пользовательского градиента. Реализация ниже повторных использований значение для tf.exp(x) , который вычисляется во время прямого прохода, что делает его более эффективным за счет устранения избыточных вычислений:

@tf.custom_gradient
def log1pexp(x):
  e = tf.exp(x)
  def grad(dy):
    return dy * (1 - 1 / (1 + e))
  return tf.math.log(1 + e), grad

def grad_log1pexp(x):
  with tf.GradientTape() as tape:
    tape.watch(x)
    value = log1pexp(x)
  return tape.gradient(value, x)
# As before, the gradient computation works fine at x = 0.
grad_log1pexp(tf.constant(0.)).numpy()
0.5
# And the gradient computation also works at x = 100.
grad_log1pexp(tf.constant(100.)).numpy()
1.0

Представление

Вычисления автоматически выгружаются на графические процессоры во время активного выполнения. Если вы хотите контролировать , где вычисление выполняется вы можете заключить его в tf.device('/gpu:0') блока (или эквивалент CPU):

import time

def measure(x, steps):
  # TensorFlow initializes a GPU the first time it's used, exclude from timing.
  tf.matmul(x, x)
  start = time.time()
  for i in range(steps):
    x = tf.matmul(x, x)
  # tf.matmul can return before completing the matrix multiplication
  # (e.g., can return after enqueing the operation on a CUDA stream).
  # The x.numpy() call below will ensure that all enqueued operations
  # have completed (and will also copy the result to host memory,
  # so we're including a little more than just the matmul operation
  # time).
  _ = x.numpy()
  end = time.time()
  return end - start

shape = (1000, 1000)
steps = 200
print("Time to multiply a {} matrix by itself {} times:".format(shape, steps))

# Run on CPU:
with tf.device("/cpu:0"):
  print("CPU: {} secs".format(measure(tf.random.normal(shape), steps)))

# Run on GPU, if available:
if tf.config.list_physical_devices("GPU"):
  with tf.device("/gpu:0"):
    print("GPU: {} secs".format(measure(tf.random.normal(shape), steps)))
else:
  print("GPU: not found")
Time to multiply a (1000, 1000) matrix by itself 200 times:
CPU: 1.007401466369629 secs
GPU: 0.04124784469604492 secs

tf.Tensor объект может быть скопирован на другое устройство для выполнения своих операций:

if tf.config.list_physical_devices("GPU"):
  x = tf.random.normal([10, 10])

  x_gpu0 = x.gpu()
  x_cpu = x.cpu()

  _ = tf.matmul(x_cpu, x_cpu)    # Runs on CPU
  _ = tf.matmul(x_gpu0, x_gpu0)  # Runs on GPU:0
WARNING:tensorflow:From /tmp/ipykernel_22287/406964202.py:4: _EagerTensorBase.gpu (from tensorflow.python.framework.ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.identity instead.
WARNING:tensorflow:From /tmp/ipykernel_22287/406964202.py:5: _EagerTensorBase.cpu (from tensorflow.python.framework.ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.identity instead.

Контрольные точки

Для вычислительных тяжелых моделей, такие как ResNet50 обучения на GPU, жаждущая производительность исполнения сопоставима с tf.function исполнения. Но этот разрыв увеличивается для моделей с меньшим объемом вычислений, и необходимо проделать работу по оптимизации путей горячего кода для моделей с большим количеством мелких операций.

Работа с функциями

В то время как активное выполнение делает разработку и отладку более интерактивными, выполнение графа в стиле TensorFlow 1.x имеет преимущества для распределенного обучения, оптимизации производительности и производственного развертывания. Для того, чтобы преодолеть этот разрыв, TensorFlow 2.0 вводит function сек через tf.function API. Для получения дополнительной информации см tf.function руководства.