TensorBoard में टेक्स्ट डेटा प्रदर्शित करना

TensorFlow.org पर देखें Google Colab में चलाएं GitHub पर स्रोत देखें नोटबुक डाउनलोड करें

अवलोकन

TensorFlow पाठ सारांश एपीआई का उपयोग कर, आप आसानी से मनमाने ढंग से पाठ लॉग इन करें और TensorBoard में देख सकते हैं। यह आपके इनपुट डेटा का नमूना लेने और उसकी जांच करने, या निष्पादन मेटाडेटा या जेनरेट किए गए टेक्स्ट को रिकॉर्ड करने के लिए बेहद सहायक हो सकता है। आप डायग्नोस्टिक डेटा को टेक्स्ट के रूप में भी लॉग कर सकते हैं जो आपके मॉडल के विकास के दौरान सहायक हो सकता है।

इस ट्यूटोरियल में, आप टेक्स्ट सारांश एपीआई के कुछ बुनियादी उपयोग के मामलों को देखेंगे।

सेट अप

try:
  # %tensorflow_version only exists in Colab.
  %tensorflow_version 2.x
except Exception:
  pass

# Load the TensorBoard notebook extension.
%load_ext tensorboard
import tensorflow as tf

from datetime import datetime
import json
from packaging import version
import tempfile

print("TensorFlow version: ", tf.__version__)
assert version.parse(tf.__version__).release[0] >= 2, \
    "This notebook requires TensorFlow 2.0 or above."
TensorFlow version:  2.5.0-dev20210219

टेक्स्ट के एक टुकड़े को लॉग करना

यह समझने के लिए कि टेक्स्ट सारांश API कैसे काम करता है, आपको बस थोड़ा सा टेक्स्ट लॉग करना होगा और देखना होगा कि इसे TensorBoard में कैसे प्रस्तुत किया जाता है।

my_text = "Hello world! 😃"
# Clear out any prior log data.
!rm -rf logs

# Sets up a timestamped log directory.
logdir = "logs/text_basics/" + datetime.now().strftime("%Y%m%d-%H%M%S")
# Creates a file writer for the log directory.
file_writer = tf.summary.create_file_writer(logdir)

# Using the file writer, log the text.
with file_writer.as_default():
  tf.summary.text("first_text", my_text, step=0)

अब, टेक्स्ट की जांच करने के लिए TensorBoard का उपयोग करें। UI को स्पिन करने के लिए कुछ सेकंड प्रतीक्षा करें।

%tensorboard --logdir logs

अनेक पाठ धाराओं का आयोजन

यदि आपके पास टेक्स्ट की एकाधिक स्ट्रीम हैं, तो आप उन्हें व्यवस्थित करने में सहायता के लिए अलग-अलग नामस्थानों में रख सकते हैं, जैसे स्केलर या अन्य डेटा।

ध्यान दें कि यदि आप कई चरणों में टेक्स्ट लॉग करते हैं, तो TensorBoard प्रदर्शित करने के लिए चरणों को सब्स्क्राइब करेगा ताकि प्रस्तुति को प्रबंधनीय बनाया जा सके। आप का उपयोग कर नमूने की दर को नियंत्रित कर सकते हैं --samples_per_plugin झंडा।

# Sets up a second directory to not overwrite the first one.
logdir = "logs/multiple_texts/" + datetime.now().strftime("%Y%m%d-%H%M%S")
# Creates a file writer for the log directory.
file_writer = tf.summary.create_file_writer(logdir)

# Using the file writer, log the text.
with file_writer.as_default():
  with tf.name_scope("name_scope_1"):
    for step in range(20):
      tf.summary.text("a_stream_of_text", f"Hello from step {step}", step=step)
      tf.summary.text("another_stream_of_text", f"This can be kept separate {step}", step=step)
  with tf.name_scope("name_scope_2"):
    tf.summary.text("just_from_step_0", "This is an important announcement from step 0", step=0)
%tensorboard --logdir logs/multiple_texts --samples_per_plugin 'text=5'

मार्कडाउन व्याख्या

TensorBoard टेक्स्ट सारांश को मार्कडाउन के रूप में व्याख्या करता है, क्योंकि समृद्ध स्वरूपण आपके द्वारा लॉग किए गए डेटा को पढ़ने और समझने में आसान बना सकता है, जैसा कि नीचे दिखाया गया है। (आप Markdown व्याख्या नहीं करना चाहते हैं, देखते हैं इस मुद्दे को दबाने व्याख्या के समाधान के लिए।)

# Sets up a third timestamped log directory under "logs"
logdir = "logs/markdown/" + datetime.now().strftime("%Y%m%d-%H%M%S")
# Creates a file writer for the log directory.
file_writer = tf.summary.create_file_writer(logdir)

some_obj_worth_noting = {
  "tfds_training_data": {
      "name": "mnist",
      "split": "train",
      "shuffle_files": "True",
  },
  "keras_optimizer": {
      "name": "Adagrad",
      "learning_rate": "0.001",
      "epsilon": 1e-07,
  },
  "hardware": "Cloud TPU",
}


# TODO: Update this example when TensorBoard is released with
# https://github.com/tensorflow/tensorboard/pull/4585
# which supports fenced codeblocks in Markdown.
def pretty_json(hp):
  json_hp = json.dumps(hp, indent=2)
  return "".join("\t" + line for line in json_hp.splitlines(True))

markdown_text = """
### Markdown Text

TensorBoard supports basic markdown syntax, including:

    preformatted code

**bold text**

| and | tables |
| ---- | ---------- |
| among | others |
"""

with file_writer.as_default():
  tf.summary.text("run_params", pretty_json(some_obj_worth_noting), step=0)
  tf.summary.text("markdown_jubiliee", markdown_text, step=0)
%tensorboard --logdir logs/markdown