TensorBoard에 텍스트 데이터 표시

TensorFlow.org에서 보기 Google Colab에서 실행 GitHub에서 소스 보기 노트북 다운로드

개요

TensorFlow 텍스트 요약 API를 사용하면 쉽게 임의의 텍스트를 기록하고 TensorBoard에서 볼 수 있습니다. 이는 입력 데이터를 샘플링 및 검사하거나 실행 메타데이터 또는 생성된 텍스트를 기록하는 데 매우 유용할 수 있습니다. 모델 개발 과정에서 도움이 될 수 있는 텍스트로 진단 데이터를 기록할 수도 있습니다.

이 자습서에서는 Text Summary API의 몇 가지 기본 사용 사례를 시도합니다.

설정

try:
  # %tensorflow_version only exists in Colab.
  %tensorflow_version 2.x
except Exception:
  pass

# Load the TensorBoard notebook extension.
%load_ext tensorboard
import tensorflow as tf

from datetime import datetime
import json
from packaging import version
import tempfile

print("TensorFlow version: ", tf.__version__)
assert version.parse(tf.__version__).release[0] >= 2, \
    "This notebook requires TensorFlow 2.0 or above."
TensorFlow version:  2.5.0-dev20210219

단일 텍스트 기록

Text Summary API의 작동 방식을 이해하기 위해 간단히 약간의 텍스트를 기록하고 TensorBoard에 어떻게 표시되는지 확인합니다.

my_text = "Hello world! 😃"
# Clear out any prior log data.
!rm -rf logs

# Sets up a timestamped log directory.
logdir = "logs/text_basics/" + datetime.now().strftime("%Y%m%d-%H%M%S")
# Creates a file writer for the log directory.
file_writer = tf.summary.create_file_writer(logdir)

# Using the file writer, log the text.
with file_writer.as_default():
  tf.summary.text("first_text", my_text, step=0)

이제 TensorBoard를 사용하여 텍스트를 검사합니다. UI가 회전할 때까지 몇 초 동안 기다립니다.

%tensorboard --logdir logs

여러 텍스트 스트림 구성

여러 텍스트 스트림이 있는 경우 스칼라 또는 기타 데이터와 마찬가지로 구성하는 데 도움이 되도록 별도의 네임스페이스에 보관할 수 있습니다.

많은 단계에서 텍스트를 기록하는 경우 TensorBoard는 프레젠테이션을 관리 가능하게 만들기 위해 표시할 단계를 서브샘플링합니다. 당신은 사용하여 샘플링 속도를 제어 할 수 있습니다 --samples_per_plugin 플래그.

# Sets up a second directory to not overwrite the first one.
logdir = "logs/multiple_texts/" + datetime.now().strftime("%Y%m%d-%H%M%S")
# Creates a file writer for the log directory.
file_writer = tf.summary.create_file_writer(logdir)

# Using the file writer, log the text.
with file_writer.as_default():
  with tf.name_scope("name_scope_1"):
    for step in range(20):
      tf.summary.text("a_stream_of_text", f"Hello from step {step}", step=step)
      tf.summary.text("another_stream_of_text", f"This can be kept separate {step}", step=step)
  with tf.name_scope("name_scope_2"):
    tf.summary.text("just_from_step_0", "This is an important announcement from step 0", step=0)
%tensorboard --logdir logs/multiple_texts --samples_per_plugin 'text=5'

마크다운 해석

TensorBoard는 텍스트 요약을 Markdown으로 해석합니다. 아래에 표시된 것처럼 풍부한 서식을 사용하면 기록하는 데이터를 더 쉽게 읽고 이해할 수 있기 때문입니다. (당신은 마크 다운 해석을하지 않을 경우, 볼 이 문제를 억제 해석에 대한 해결책을.)

# Sets up a third timestamped log directory under "logs"
logdir = "logs/markdown/" + datetime.now().strftime("%Y%m%d-%H%M%S")
# Creates a file writer for the log directory.
file_writer = tf.summary.create_file_writer(logdir)

some_obj_worth_noting = {
  "tfds_training_data": {
      "name": "mnist",
      "split": "train",
      "shuffle_files": "True",
  },
  "keras_optimizer": {
      "name": "Adagrad",
      "learning_rate": "0.001",
      "epsilon": 1e-07,
  },
  "hardware": "Cloud TPU",
}


# TODO: Update this example when TensorBoard is released with
# https://github.com/tensorflow/tensorboard/pull/4585
# which supports fenced codeblocks in Markdown.
def pretty_json(hp):
  json_hp = json.dumps(hp, indent=2)
  return "".join("\t" + line for line in json_hp.splitlines(True))

markdown_text = """
### Markdown Text

TensorBoard supports basic markdown syntax, including:

    preformatted code

**bold text**

| and | tables |
| ---- | ---------- |
| among | others |
"""

with file_writer.as_default():
  tf.summary.text("run_params", pretty_json(some_obj_worth_noting), step=0)
  tf.summary.text("markdown_jubiliee", markdown_text, step=0)
%tensorboard --logdir logs/markdown